Aarhus Universitets segl

QGG Big Data Software

Hos QGG analyserer vi store mængder af fænotypiske og genomiske data, der hjælper landmænd med at avle sundere og mere produktive dyr og planter.

Disse omfattende analyser giver information om og statistik på genetiske markører i hele genomet. Informationen kan bruges til at forbedre den genomiske selektion og derigennem finde de bedste avlsdyr på tværs af hele populationer. Genomisk selektion kan for eksempel øge hyppigheden af det genetiske udbytte ved en lavere risiko for yverbetændelse hos køer, en lavere dødelighed hos kalve eller mere modstandsdygtige græsarter med længere rødder, der bedre kan overleve i tørre områder.

I hjertet af QGGs forskning findes vores stærkeste og vigtigste forskningsværktøj: en HPC (High Performance Computing) Linux Cluster med cirka 500 cores, 100 Terabyte data og et hurtigt netværk. HPC clusterne bliver opdateret regelmæssigt.

Den stærke regnekraft gør os i stand til at udvikle og forbedre statistiske modeller til genomiske prædiktioner, genomisk selektion og avlsprogrammer. De arter, vi indtil nu har arbejdet med, er kvæg, svin, mink, heste, fjerkræ og ørreder, samt plantearter som græsser, korn, bønner, kløver og kartofler. Vi er i stigende grad begyndt at forske i humangenetik. 

Kalkulationer af så komplekse datasæt kræver særlig software, og hos QGG har vi nu fem specialfremstillede softwarepakker, der gør det muligt for os at udtrække forskellige perspektiver og værdier fra en stor og meget varieret datamængde.

ADAM

ADAM er et computerprogram der simulerer selektive dyreavlsplaner ved hjælp af stokastisk simulation. Programmet simulerer en dyrepopulation og sporer de genetiske ændringer i populationen i forskellige, selektive avlsscenarier. Det tager højde for forskellige populationsstrukturer, genetiske modeller, selektionsstrategier og parringsdesigns. ADAM kan bruges til at evaluere avlsplaner og generere genetiske data til afprøvning af statistiske værktøjer.

ADAM er udviklet af A.C. Sørensen, M. Henryon, S. Ansari-Mahyari, L.D. Pedersen & P. Berg

EVA

EVA er et værktøj til avlsplanlægning på populationsniveau

EVA udfører to opgaver:

1. Beskrivelse af populationers historie med hensyn til

 Individuelle indavlskoefficienter og stamtavlens fuldstændighed

  • Gennemsnits indavl, fælles herkomst, stamtavlefuldstændighed og generationsækvivalens per kohorte
  • Genetiske bidrag fra:
    • Alle grundlæggere
    • De mest bidragende stamfædre
    • Ethvert brugerspecificeret individ til ethvert individ eller kohorte

2. Optimering af genetiske bidrag

  • Optimerer den genetiske merits lineære funktion og gennemsnitlige additive genetiske slægtskaber
  • Betinget af optimale bidrag kan individer parres vilkårligt eller ved minimering af indavl i afkommet

Ved optimal afbalancering af indavl og genetisk udbytte giver EVA mulighed for bæredygtige og langsigtede avlsbeslutninger uanset populationsstørrelse eller populationsstruktur. EVA er med succes anvendt og testet i både kommercielle og truede populationer.

For at bruge EVA er det nødvendigt med præcis og konsistent stamtavleinformation. I de fleste tilfælde har en almindelig kontorpc nok kapacitet til at køre EVA, dog med undtagelse af meget store populationer.

EVA kan gratis benyttes til Windows, Linux og Mac. 

EVA er udviklet af: Peer Berg, Morten Kargo

DMU

DMU er en statistisk softwarepakke, der er udviklet til applikationer indenfor kvantitativ genetik og genomforskning. Pakken implementerer stærke sandsynlighedsbaserede værktøjer til vurdering af varianselementer, fastlagte virkninger (BLUE), og til forudsigelse af vilkårlige virkninger (BLUP), såvel som værktøjer til Bayesiske følgeslutninger om sprednings- og lokationsparametre. Udviklingen af DMU er drevet af behovene i en række projekter i anvendt kvantitativ dyregenetik og genomforskning over en periode på ~30 år. Et generelt overblik over modulerne i DMU og deres funktioner bliver diskuteret i Madsen et al (2010), Madsen & Jensen (2013) og i Madsen et al (2014).

DMU er udviklet og vedligeholdt af: P. Madsen, J. Jensen, G. Su, O.F. Christensen, R. Labouriau og V. Milkevych.

Bayz

Bayz implementerer bayesianske modeller til estimering af varianskomponenter, genomisk prædiktion og genkortlægning. En af programmets nøgleegenskaber er at tillade hierarkiske modeller, der giver mulighed for en tilpasning af modellerne til komplekse datastrukturer og at specificere komplekse varians- og covariansstrukturer. Bayz passer til store multi-egenskabsmodeller, modeller med gentagne observationer, modeller for vilkårlig regression og modeller for sociale indvirkninger, og kan kombinere disse egenskaber med populære versioner af bayesianske prædiktions- og kortlægningsmodeller så som SNP-BLUP, (power) LASSO og bayesianske Variable Selection modeller. Et nemt R interface er til rådighed, som giver mulighed for at tilpasse de mest almindelige modeller, der bruges. Bayz er gratis at bruge i forskningsøjemed, men der skal udleveres en licensnøgle.

Bayz er udviklet af: Luc Janss

Du finder Bayz hjemmesiden her.  

LDAK

 

LDAK er en softwarepakke til analyse af data fra genetiske associationsstudier. Den leverer redskaber til at estimere SNP heritabilitet (både fra data på individniveau og summarisk statistik), påvise kausale varianter og gener (både gennem klassiske og blandede modelanalyser), opbygge prædiktionsmodeller (herunder MultiBLUP og MegaPRS), og evaluere heritabilitetsmodeller (inklusive at estimere heritabilitetsberigelse). LDAK er skrevet i C og designet til at køre på Linux eller Mac computere. 

LDAK er udviklet af: Doug Speed

LDAKs hjemmeside finder du her.