Slik kan kunstig intelligens finne mikroskopiske fossiler

Forskere på UiT har trent opp kunstig intelligens til å finne og kategorisere mikrofossiler. – Vi tror arbeidet kan bli til stor nytte for geologer verden over, sier stipendiat Iver Martinsen.

Mann sitter foran datamaskin
Doktorgradskandidat i Maskinlæringsgruppen på UiT, Iver Martinsen, viser fram hvordan KI-en finner og kategoriserer mikrofossiler på mikroskopbilder. Photo: privat
Portrettbilde av Bjørklund, Petter
Bjørklund, Petter petter.bjorklund@uit.no Kommunikasjonsrådgiver / Maskinlæring
Published: 10.09.24 08:15 Updated: 10.09.24 14:44
Climate Natural Sciences Technology

Mikrofossiler er bittesmå, eldgamle fossiler som fins for eksempel på strender og isbreer og ved varmekilder. Studiet av mikrofossiler kan fortelle oss mye om den geologiske tidsalderen de stammer fra og hvordan klimaet på jorden var på den tiden.

Repetitivt arbeid

Den tradisjonelle måten å studere fossilene på er å sette fossilprøver under et mikroskop og telle hvert enkelt fossil for hånd. Noen er lette å identifisere, andre krever mer tid under mikroskopet. Det er et delikat arbeid som ikke bare krever geologisk kompetanse, men også enorm tålmodighet.

– Det er et ganske repetitivt arbeid. Man gjør det samme om igjen og om igjen i flere uker. Vi har også store mengder sedimentkjerner på lageret som skulle vært analysert, noe som vi kanskje aldri rekker å gjøre, sier geolog Steffen Aagaard Sørensen.

Hender under mikroskop.
Å studere mikrofossiler for hånd er et tidkrevende arbeid. Her teller geolog Steffen Aagaard Sørensen en fossil om gangen for å finne ut hvilke typer de er. Foto: Petter Bjørklund/UiT

Nå har forskere i Maskinlæringsgruppen ved UiT, Equinor og SFI Visual Intelligence utviklet kunstig intelligens (KI) som gjør jobben lettere. Den kan nemlig automatisk finne og kategorisere mikrofossiler på mikroskopbilder. Forskningen er nylig publisert i tidsskriftet Artificial Intelligence in Geosciences, med doktorgradskandidat Iver Martinsen i Maskinlæringsgruppen som førsteforfatter.

Gjør arbeidet hundre ganger raskere

Å ha et program som automatiserer arbeidet byr på en rekke fordeler. Blant annet kan det spare geologer som Sørensen for mye tidkrevende arbeid på laboratoriet.

Om SFI Visual Intelligence

  • Et senter for forskningsdrevet innovasjon (SFI) som har som formål å utvikle nye dyplæringsmetoder for å hente ut viktig informasjon fra ulike og komplekse bildedata.
  • Senteret ønsker å utvikle bedre verktøy for blant annet å oppdage hjertesykdommer og kreft, og overvåke miljø, klima, risiko og potensielle naturkatastrofer.
  • Tilnærmingen til senteret er tverrfaglig. Analysemetodikk som utvikles innen ett senterområde, kan ofte være til nytte på andre fagområder.
  • Forskningspartnerne i senteret er UiT, Universitetet i Oslo og Norsk Regnesentral.

– Geologer bruker mange timer på å studere mikrofossiler. Ved å utvikle et slikt verktøy har vi tro på at vi kan gjøre leteoppgaven enklere, sier Martinsen.

Dermed kan geologene raskere finne svar på spørsmålene om jordens geologiske historie og fortidige klima.

– Har man et program som kan utføre arbeidet like godt som et menneske, vil analysene kunne gå ti, kanskje hundre, ganger kjappere, sier Sørensen.

Fossiler beskrevet i tall

KI-programmet er utviklet gjennom en trinnvis prosess. Først har forskerne brukt en objektgjenkjenner som er forhåndstrent til å finne og hente ut mikrofossiler fra et datasett med mikroskopbilder. Det gjøres ved at gjenkjenneren lager avgrensningsbokser rundt hvert fossil.

Datasettet består av utvalgte mikroskopdata fra Diskos; et nasjonalt datalager for lete- og utvinningsrelatert informasjon fra den norske kontinentalsokkelen. Datautvalget består av cirka 100 000 mikrofossiler.

De uthentede fossilene er brukt til å trene programmet til å lage såkalte «vektor-representasjoner» for hvert fossil. Hver representasjon består av flere hundre tallverdier som beskriver hvordan en spesifikk type mikrofossil ser ut.

Modeller som viser en såkalt objektgjenkjenner.
Illustrasjonen viser hvordan en objektgjenkjenner brukes til å hente ut mikrofossiler fra mikroskopbilder. Hvert fossil brukes til å trene KI-en til å lage "vektor-representasjoner" for fossilene. Foto: Iver Martinsen/SFI Visual Intelligence

– Man kan se på en vektor-representasjon som en oppsummert beskrivelse av innholdet på et bilde, bare i tall. All informasjon fra bildedataene blir dermed kodet inn i en tallrekke, forklarer Martinsen.

Blir programmet vist et mikroskopbilde det aldri har sett før, bruker den representasjonene som referanser for å finne mikrofossiler på det nye bildet.

Matcher innholdet i bildet med en eller flere representasjoner, er det et tegn på at det inneholder fossiler av samme art.

Lærer av seg selv

Ved å lage egne matematiske beskrivelser av hvert fossil, lærer programmet selv hvordan ulike fossilarter ser ut. Dette kaller forskerne for "selvovervåket læring", som innebærer at programmet lærer å forstå innholdet i bildedataene bedre.

– Med andre ord har den trent opp seg selv til å bli god til å tolke bilder, i dette tilfellet av mikrofossiler. Dette arbeidet er det første hvor man har brukt store mengder umerkede data til å utvikle et program for å finne mikrofossiler, sier Martinsen.

Stor interesse fra verdens største museumskompleks

For å undersøke hvor godt programmet fungerer, har forskerne sammenlignet det med lignende metoder utviklet av Facebook-selskapet Meta.

Resultatene viser at KI-en som UiT-forskerne har utviklet finner og beskriver ulike mikrofossiler på en mer nøyaktig måte enn det som har vært gjort tidligere.

To firkanter som inneholder små bilder av mikrofossiler.
Bildet viser hvordan det nye programmet (t.v.) klarer å skille mellom og finne flere mikrofossiler på mikroskopbilder enn tradisjonelle KI-metoder (t.h.). Foto: Iver Martinsen/Visual Intelligence

– Vi er veldig fornøyde med resultatene, som viser at beskrivelsene til programmet er bedre og mer egnet til å finne mikrofossiler, sier Martinsen.

– Vi tror arbeidet kan være til stor nytte for geologer verden over, for de som jobber innen industri eller akademia, legger han til.

I etterkant av publiseringen har Martinsen mottatt en rekke henvendelser fra geologiske fagmiljø verden over.

The Smithsonian Institution i USA, som er landets nasjonalmuseum og verdens største museumskompleks, er blant dem som har vist stor interesse for programmet.

– Det er veldig spennende når arbeidet vårt vekker så stor interesse. Det viser at arbeidet vi gjør er nyttig for veldig mange og at teknologien har relevans langt utenfor en enkelt bransje eller ett verdensområde, sier Martinsen.

Referanse

Iver Martinsen, David Wade, Benjamin Ricaud, & Fred Godtliebsen: The 3-billion fossil question: How to automate classification of microfossils.

Bjørklund, Petter petter.bjorklund@uit.no Kommunikasjonsrådgiver / Maskinlæring
Published: 10.09.24 08:15 Updated: 10.09.24 14:44
Climate Natural Sciences Technology