Nyt GWAS-værktøj fungerer hurtigere og finder flere signifikante genetiske varianter end eksisterende værktøjer
LDAK-KVIK er et nyt GWAS-værktøj designet til at udføre hurtig og effektiv mixed-model associationsanalyse af kvantitative og binære fænotyper, hvilket i høj grad vil forbedre forståelsen af det genetiske grundlag for sygdomme og motivere udviklingen af nye lægemiddelbehandlinger til mennesker. Professor Doug Speed og postdoc Jasper Hof fra Center for Kvantitativ Genetik og Genomforskning (QGG) har for nylig fået deres seneste arbejde offentliggjort i Nature Genetics.

Mange menneskelige træk er stærkt påvirket af vores DNA. For eksempel bestemmer genetiske varianter, om vi har tendens til at være højere eller lavere end gennemsnittet, eller om vi har større eller mindre sandsynlighed for at udvikle sygdomme. Et Genome-Wide Association Study (GWAS) er et statistisk værktøj til at finde ud af, hvilke genetiske varianter der er vigtigst for en bestemt egenskab. I løbet af det sidste årti har GWAS identificeret DNA-varianter for tusindvis af menneskelige træk.
Selvom eksisterende værktøjer til at udføre GWAS er succesfulde, har de en tendens til at være beregningskrævende. For eksempel kan et af de mest populære værktøjer, BOLT-LMM, bruge uger på at analysere data for 400.000 individer. For at løse dette problem udviklede Jasper Hof og Doug Speed LDAK-KVIK, et nyt GWAS-værktøj, der er væsentligt mere effektivt end eksisterende værktøjer. Helt konkret har LDAK-KVIK tre hovedfordele. For det første behøver det kun at få indlæst data for 250 genetiske varianter ad gangen, hvilket betyder, at dets beregningsmæssige krav er meget lavere end eksisterende metoder, som indlæser op til en million genetiske varianter. For det andet inkorporerer LDAK-KVIK avancerede modeller for den forventede betydning af forskellige genetiske varianter, hvorimod eksisterende værktøjer antager, at alle varianter bidrager lige meget. For det tredje kan LDAK-KVIK både teste individuelle genetiske varianter og sæt af genetiske varianter og kan derfor mere præcist lokalisere de områder af DNA, der påvirker forskellige træk.
LDAK-KVIK er netop blevet offentliggjort i tidsskriftet Nature Genetics. Artiklen starter med at forklare de beregningsmæssige tricks, som LDAK-KVIK bruger til at reducere både procestid og hukommelsesforbrug. Derefter sammenligner artiklen LDAK-KVIK med fire eksisterende GWAS-værktøjer. Resultaterne viser, at LDAK-KVIK kan analysere data for 400.000 individer på mindre end ti CPU-timer, hvilket betyder, at det er langt hurtigere end den nærmeste konkurrent, BOLT-LMM. Endelig analyserer artiklen 40 komplekse træk registreret i UK Biobank og demonstrerer, at LDAK-KVIK konsekvent finder flere signifikante genetiske varianter end de fire eksisterende GWAS-værktøjer (se figur ovenfor).
Førsteforfatter, postdoc Jasper Hof fra QGG, forklarer: "Ved at udvikle LDAK-KVIK har vi sat en ny standard for statistisk software, der analyserer GWAS-data. Da vi udviklede denne metode indså Doug og jeg, hvor vanskeligt det er at skabe software, der kan håndtere og analysere store GWAS-datasæt. Jeg er stolt over, at det er lykkedes for os, og jeg er begejstret for udsigten til at bruge vores udviklede software til at tackle nye udfordringer inden for statistisk genetik."
Udover publikationen har forfatterne også oprettet hjemmesiden www.ldak-kvik.com, som indeholder detaljer om, hvordan man downloader og kører det nye værktøj.
Supplerende oplysninger | |
Vi bestræber os på, at alle vores artikler lever op til Danske Universiteters principper for god forskningskommunikation. På den baggrund er artiklen suppleret med følgende oplysninger: | |
Studietype | Statistisk Human Genetik |
Finansiering
| Aarhus Universitets ForskningsFond (AUFF) Danmarks Frie Forskningsfond (projekt nr. 7025-00094B) European Research Council Consolidator Grant (ID 101088901, acronym: ClassifyDiseases). |
Interessekonflikter | Forfatterne erklærer, at der ikke er interessekonflikt. |
Læs mere | |
Kontakt |