Samisk språkteknologi kan berge tusenvis av språk
90 prosent av verdens 7000 språk kan ikke brukes på mobiltelefoner, datamaskiner og i sosiale medier. UiT har utviklet språkteknologi som løser problemet.
2019 er FN-året for urfolksspråk, og da FN skulle markere språkåret i FN-bygningen, var de språkteknologiske forskningsmiljøene Divvun og Giellatekno fra UiT Norges arktiske universitet invitert til New York for å fortelle hvordan de jobber med språkteknologi.
– Vi fortalte om våre tekniske løsninger og hvordan vi tenker. Vårt fokus er samisk, men alt vi lager av teknologiske løsninger er tilpasset alle verdens skriftspråk. Våre mobiltastaturer, våre retteprogrammer, våre elektroniske ordbøker, kan brukes at de alle fleste språk i verden. Alt er tilgjengelig for alle, helt gratis, sier Sjur Moshagen, prosjektleder i Divvun.
I FN-bygningen var representanter fra urfolksspråk over hele verden til stede for å høre på UiT-forskerne, og flere tok kontakt for å lære mer om mulighetene samisk språkteknologi kan gi for deres eget språk. Ifølge tall fra FN-organisasjonen Unesco snakker 97 prosent av verdens befolkning kun fire prosent av alle verdens språk. Det betyr at mer enn 6000 av verdens språk blir brukt av kun tre prosent av jordas befolkning.
– Selv om prosentandelen er liten, gjelder det mer en 230 millioner mennesker. De aller fleste av språkene de bruker har ikke tastaturer fra Microsoft, Apple eller Linux og blir derfor ikke brukt på datamaskiner, mobiltelefoner eller i sosiale medium. Veldig mange språksamfunn ønsker teknologiske løsninger som gjør at de kan bruke eget morsmål i sammenhenger som i dag ikke er mulig. Det kan vi tilby, sier Sjur Moshagen.
Selv om den teknologiske løsningen er gratis, må de som skal ta UiT-løsningene i bruk likevel investere både tid og penger.
– Vi tilbyr et teknologisk rammeverk som de selv må fylle med innhold. De må for eksempel selv legge inn alle ord og all grammatikk selv, sier Moshagen. Han vet av erfaring at det er tidkrevende.
– Men det er et arbeid du gjør en gang, og som du får veldig mye igjen for, sier Moshagen. Han ser for seg at den samiske språkteknologien også kan brukes til å lære seg nye språk, og i nær framtid kanskje også bidra til at kunstig intelligens og roboter kan bruke urfolksspråk.
– I dag er krever denne teknologien store ressurser i form av elektronisk tekst som små urfolksspråk ikke kan tilby. Men dette utvikler seg, og kanskje vil våre teknologiske løsninger føre til at også små språk, små språksamfunn få ta del i denne teknologiske utviklingen, sier Moshagen.
Mens de store teknologiselskapene utvikler programmer som oversetter ett stort språk til et annet, jobber UiT-forskerne for å få på plass lignende løsninger også for små språk.
– Dette er fullt mulig, men foreløpig er denne løsningen ikke tilgjengelig i for eksempel Google Translate. Men for nordsamisk har vi allerede løsninger som gjør at du kan oversette nettsider til norsk ved noen få tastetrykk, sier Moshagen.
Verdens første tekst-til-tale-program for urfolksspråk
No kjem stavekontroll til mobilen
Dette programmet oversetter fra nordsamisk til norsk
Nytt tastatur til truede samiske språk
Ny teknologi kan redde truede språk