Avl

Maskinlæring av genetisk hornstatus for ikkje-genotypa dyr

Ny metode vil gje auka avlsframgang for kolla-egenskapen.

Arne Gjuvsland

Avlsforsker i Geno

arne.gjuvsland@geno.no

12136 Hauen er en homozygot kollet (KK) NRF-eliteokse. Foto: Jan Arve Kristiansen

Å auka frekvensen av kolla dyr har vore eit mål i NRF-avlen sidan 1990-talet. I starten var det viktigaste tiltaket at når ein rekrutterte etter kolla oksar så var det berre kolla søner som blei kjøpt inn. I 2012, da genotyping blei tatt i bruk til utvalg av testoksar, blei det også laga ein test for genetisk horn­status (kolla-genotype). Dermed kunne ein skilla mellom heterozygot kolla (KH) og homozygot kolla (KK) oksar. I 2017 blei kolla tatt inn i avlsmålet og i 2019 blei vekta auka til 5.3 prosent av avlsmålet.

Låg sikkerheit bremsar avlsframgangen for kolla

I utrekninga av avlsverdi er det talet på kolla-allel (allel er alternative utgaver av samme gen) som går inn som egenskap. For genotypa dyr bestemmer me dette med svært høg sikkerheit (>0.99). For ikkje-genotypa dyr er det fram til no hornanlegg registrert ved kalving som har blitt brukt. Figur 1 viser fordelinga av genetisk hornstatus og registrert hornanlegg for genotypa kalvar. For ikkje-genotypa dyr, blir denne fordelinga blir brukt til å rekna ut at forventa tal på kolla-allel frå registrert horn­anlegg. Ei utfordring ved å bruka hornanlegg er at sjøl med perfekte registreringar vil ein ikkje kunna skilla mellom KH (heterozygot) og KK (homozygot kollet). I tillegg er det slik at ein del HH-kalvar (homozygot horna) blir registrert som kolla eller ukjent og nær 25 prosent av KH-kalvane blir registrert som horna (Figur 1). Noko av dette er nok feilregistrering, men for ein del kalvar er det er vanskeleg å vurdera hornanlegget, spesielt for dyr med nyvler (sjå Buskap 7, 2019). Uansett årsak fører dette til lågare sikkerheit (ca 0.8) for ikkje-genotypa dyr. I og med at berre rundt 15 prosent av NRF-kalvane blir genotypa begrensar dette avlsframgangen for kolla i heile populasjonen.

Figur 1: Registrert hornanlegg og genetisk hornstatus for 127 232 genotypa kalvar fødde frå 2005 og seinare. Kalvane er gruppert etter genetisk hornstatus: HH (86 063 dyr), KH (37 208 dyr), KK (3 961 dyr) og registrert hornanlegg: Horna (79 056 dyr), Kolla (35 205 dyr) og Ukjent (12 971 dyr). Venstre panel: Fordeling av registrert hornanlegg (fargekode) for dyr gruppert etter kolla-genotype (x-akse). Høgre panel: Fordeling av kolla-genotype (fargekode) for dyr gruppert etter registrert hornanlegg (x-akse).

Ulike kjelder til informasjon om genetisk hornstatus

Hornanlegg seier mykje om genetisk hornstatus, men det er fleire andre relevante registreringar. Til dømes vil avhorning tala for at dyret er HH, men dersom det er ein oksekalv er det også mulig at den er KH og har nyvlar. Genetisk hornstatus til far og mor eller ­morfar inneheld også mykje informasjon. For ei ku som har fått fleire kalvar, vil registreringar på kalvane ha informasjon om kua sin genotype. Vidare er det ­variasjon i kvalitet på registreringane mellom buskapar og graden av samsvar mellom registrerte hornanlegg og avhorning varierer.

Korleis kan ein så kombinera alle desse registreringane for å laga ein god prediksjon (forutseiing) av den genetiske hornstatusen til eit dyr som ikkje er genotypa? Dei siste ti åra har det vore ei rivande utvikling innan maskinlæring og kunstig intelligens, med metodar som kan avdekka mønster i store datasett og bruka desse til å ­predikera viktige egenskapar. Dei største gjennombrudda har vore innan analyse av komplekse datatypar som bilde, tekst eller data frå bruk av sosial medier. Desse nye metodane har vore prøvd ut til å rekna avlsverdiar, men har så langt ikkje fungert bedre enn dei tradisjonelle, lineære modellane. Men, etter å ha testa litt viser det seg at maskinlæring fungerer bra til prediksjon av genetisk horn­status.

Tabell 1 Data frå Kukontrollen og Geno til prediksjon av genetisk hornstatus

Individ/buskap

Data som blir brukt til prediksjon

Dyret som skal få predikert genetisk hornstatus

Alle dyr: Hornanlegg, avhorning, alder ved avhorning, kjønn og fødselsår

Kyr: Talet på kalvar, kolla kalvar og avhorna kalvar. Summen av kolla-allel frå fedrene til kalvane

Far, morfar og mormors far

Genetisk hornstatus

Mor

Hornanlegg, avhorning og eventuelt genetisk hornstatus

Buskap

Talet på dyr i buskapen, kor stor del av dyr i buskapen som er registrert som horna/ukjent. Graden av samsvar (korrelasjon) mellom «registrert horna/ukjent» og avhorna.

Maskinlæring gjer høgare sikkerheit

Tabell 1 gjer oversikt over data henta ut frå Kukontrollen, geno­typedata og slektskapsinformasjon. Dette datasettet kombinert med kjent genetisk hornstatus på dei genotypa dyra blei brukt til å trena opp maskinlæringsmodellar som kan predikera genetisk hornstatus for alle dyr. Den beste modellen gjer sikkerheit på 0.93, ei klar forbedring frå dagens metode. Modellen predikerer talet på kolla-allel ved å oppsummerera alle registreringane for eit dyr i eit desimaltall mellom 0 og 2. Figur 2 viser gjennomsnitt av ­predikert mot faktisk genetisk hornstatus for genotypa dyr. Ved genotyping (svart) blir talet på ­kolla-allel bestemt nøyaktig. Ved å bruka registrert hornanlegg (raud) greier ein å skilla HH-dyr frå KH/KK, men talet på kolla-allel blir klart undervurdert for KH-dyra og kraftig undervurdert for KK-dyr. Maskinlæring (grøn) gjer betre prediksjonar over heile linja, HH-dyr får snitt-prediksjonar nærare 0 (ingen kolla-allel), KH-dyr nær 1 og KK-dyr godt over 1.

Figur 2: Samanlikning av metodar for prediksjon av genetisk hornstatus for genotypa dyr. Det faktiske talet på kolla-allel (x-akse) mot gjennomsnittleg predikert tal på kolla-allel (y-akse) ved bruk av registrert hornanlegg (oransje), maskinlæring (grøn) og genotyping (svart). For å unngå overtilpassing og overvurdering av maskinlæringsmodellen er det gjort kryssvalidering, der genetisk hornstatus blir halde utanfor for ein del av dei genotypa dyra under opptreninga av modellen og så samanliknar ein predikert status med fasiten etterpå.

Endring i avlsverdiar og forventa auke i avlsframgang

Me implementerer denne for­bedringa i predikert genetisk hornstatus i avlsverdiutrekninga i løpet av sommaren 2021. Overgangen frå bruk av hornanlegg vil gjera at avlsverdien endrar seg for mange dyr, men endringa vil gje bedre sikkerheit og dermed auka avlsframgang for kolla uten å endra vekta i avlsmålet. Alle seminoksar blir genotypa før seleksjon, men på morsida er det mange gode dyr som ikkje er genotypa og desse dyra får no sikrare ­verdiar for kolla. Ved utlisting av mødre til seminokseemne og aktuelle embryokviger vil kolla kyr havna lenger opp på lista og det vil dermed bli fleire kolla kalvar å selektera frå.