1000 genom

Som et vitnesbyrd om det jevne stupet i sekvenseringskostnader, er det i dag National Human Genome Research Institute (NHGRI) annonserte et massivt internasjonalt samarbeid for å sekvensere genomene til 1000 mennesker fra hele verden.





Ifølge NHGRI uttalelse ,

1000 Genomes Project vil undersøke det menneskelige genomet på et detaljnivå som ingen har gjort før, sa Richard Durbin, Ph.D., fra Wellcome Trust Sanger Institute, som er medformann i konsortiet. Et slikt prosjekt ville vært utenkelig for bare to år siden. I dag, takket være fantastiske fremskritt innen sekvenseringsteknologi, bioinformatikk og populasjonsgenomikk, er det nå innenfor vår rekkevidde. Så vi går fremover for å bygge et verktøy som vil utvide og ytterligere akselerere innsatsen for å finne flere av de genetiske faktorene som er involvert i menneskers helse og sykdom.

Funnene bør gi ekstra kraft til den siste bølgen av studier som identifiserer spesifikke genetiske risikofaktorer for vanlige helseproblemer, som diabetes, hjertesykdom, lupus og andre. (Se gener for flere vanlige sykdommer funnet.)



I følge NHGRI-direktør Francis Collins,

Dette nye prosjektet vil øke følsomheten til sykdomsoppdagelsesarbeid på tvers av genomet fem ganger og i genregioner minst 10 ganger. Våre eksisterende databaser gjør en rimelig god jobb med å katalogisere variasjoner som finnes i minst 10 prosent av en befolkning. Ved å utnytte kraften til nye sekvenseringsteknologier og nye beregningsmetoder, håper vi å gi biomedisinske forskere et genomomfattende variasjonskart ned til 1 prosent nivå. Dette vil endre måten vi gjennomfører studier av genetisk sykdom på.

I likhet med tidligere internasjonale sekvenseringsprosjekter vil dataene gjøres tilgjengelig for analyse i gratis offentlige databaser. Når forskerne identifiserer en del av genomet assosiert med en bestemt sykdom, vil de kunne slå opp det området av genomet i databasen for å finne en liste over genvarianter i den regionen.



Prosjektet blir en stor teknologisk bragd; til dags dato har bare tre menneskelige genomer blitt sekvensert.

Fra NHGRI:

Prosjektet er avhengig av storskala implementering av flere nye sekvenseringsplattformer. Ved å bruke standard DNA-sekvenseringsteknologier vil innsatsen sannsynligvis koste mer enn 500 millioner dollar. Ledere av 1000 Genomes Project forventer imidlertid at kostnadene vil være langt lavere – i størrelsesorden $30 millioner til $50 millioner – på grunn av prosjektets banebrytende innsats for å bruke nye sekvenseringsteknologier på den mest effektive og kostnadseffektive måten.



I den første fasen av 1000 Genomes Project, som varer rundt ett år, skal forskerne gjennomføre tre piloter. Resultatene fra pilotene vil bli brukt til å bestemme hvordan man mest effektivt og kostnadseffektivt produserer prosjektets detaljerte kart over menneskelig genetisk variasjon.

Den første piloten vil innebære sekvensering av genomene til to kjernefamilier (både foreldre og et voksent barn) med dyp dekning som i gjennomsnitt utgjør 20 passeringer av hvert genom. Dette vil gi et omfattende datasett fra seks personer som vil hjelpe prosjektet med å finne ut hvordan man kan identifisere varianter ved hjelp av de nye sekvenseringsplattformene, og tjene som sammenligningsgrunnlag for andre deler av innsatsen.

Den andre piloten vil innebære sekvensering av genomene til 180 personer med lav dekning som i gjennomsnitt utgjør to passeringer av hvert genom. Dette vil teste muligheten til å bruke lavdekningsdata fra nye sekvenseringsplattformer for å identifisere sekvensvarianter og sette dem inn i deres genomiske kontekst.



Den tredje piloten vil innebære sekvensering av kodende regioner, kalt eksoner, av rundt 1000 gener hos rundt 1000 mennesker. Dette er rettet mot å utforske hvordan man best kan få en enda mer detaljert katalog i de omtrent 2 prosentene av genomet som består av proteinkodende gener.

I løpet av den toårige produksjonsfasen vil 1000 Genomes Project levere sekvensdata med en gjennomsnittlig hastighet på rundt 8,2 milliarder baser per dag, tilsvarende mer enn to menneskelige genomer hver 24. time. Datavolumet – og tolkningen av disse dataene – vil utgjøre en stor utfordring for ledende eksperter innen bioinformatikk og statistisk genetikk.

De 1000 frivillige vil bli valgt ut blant de som deltok i HapMap-prosjektet, et kart over vanlig genetisk variasjon (se A New Map for Health ), og vil inkludere:

Yoruba i Ibadan, Nigeria; japansk i Tokyo; kinesisk i Beijing; Innbyggere i Utah med aner fra Nord- og Vest-Europa; Luhya i Webuye, Kenya; Masai i Kinyawa, Kenya; Toscani i Italia; Gujarati-indianere i Houston; kinesisk i storbyen Denver; mennesker av meksikansk aner i Los Angeles; og folk med afrikansk aner i det sørvestlige USA.

gjemme seg