Verdens første tekst-til-tale-program for urfolksspråk

Stemmen til Laila Oskarsson skal hjelpe tusenvis av nordmenn, svensker og finner til å lære å lese og skrive sitt morsmål – nordsamisk. I dag lanserer Sametinget og UiT Norges arktiske universitet verdens første tekst-til-taleprogram for urfolksspråk.
Brøndbo, Stig
Published: 06.05.15 13:00 Updated: 06.05.15 22:29

Universitetslektor Laila Oskarsson synes det er rart å høre sin egen stemme digitalisert, men er svært fornøyd med det nye dataprogrammet som gjør at all elektronisk tekst på nordsamisk nå kan bli lest av en datamaskin. Foto: Stig Brøndbo

– Det er litt rart å høre seg selv snakke, men jeg blir vel vant til det, sier universitetslektor Laila Oskarsson. Hun smiler og snakker samtidig som hennes egen stemme kommer ut fra høyttalerne på datamaskinen som står på bordet foran henne. Det er første gangen hun hører det ferdige produktet – talesyntesen som gjør at all nordsamisk tekst som kan vises på en dataskjerm også kan leses høyt av et dataprogram.

– Elektrovnnalaš lohkanveahki almmuhuvvo davvi sámegielas dán gaskavahkku, leser maskinen fra nettavisen avvir.no.

– Elektronisk lesehjelp publiseres på nordsamisk kommende onsdag.

 

Helt fantastisk

Sammen med UiT-lektoren sitter studentene som tar årsstudium i samisk  ved UiT Norges arktiske universitet. I dataprogrammet heter lærer-Laila sin stemme «Elle», samme navn som hennes eldste datter.

– Da jeg prøvde en tidlig versjon av programmet hjemme kjente ungene igjen stemmen min med en gang, sier Laila Oskarsson. Det samme gjør studentene, og etter å ha hørt den kunstige lærerstemmen lese hele avisartikkelen om talesyntesen, samt hørt den virkelige lærerstemmen og prosjektleder Sjur Moshagen fortelle litt mer om programmet, smiler de.

– Det er jo helt fantastisk. Nå kan vi høre hvordan ordene skal uttales og vi ser hvordan de skrives, sier Therese Alvestad.

– Dette blir veldig nyttig for oss. Nå kan vi lytte mer til samiske tekster, og det blir ekstra kjekt å ha til neste år, når jeg ikke har deg som lærer mer og blir å savne stemmen din, sier Inga Lillevoll – og ler.

 

Undervisning

Berit Anne Bals Baal, Sjur Moshagen og Ritva Nystad ved UiT Norges arktiske universitet er fornøyd med tekst-til-tale-programmet de har vært med å utvikle. Foto: Stig Brøndbo

– Dette blir et verdifullt verktøy i språkundervisningen, sier førsteamanuensis ved Institutt for språkvitenskap, Berit Anne Bals Baal. Hun har bidratt i talesyntesen med språkkunnskap helt ned på minste språklydnivå og har ikke tall på hvor mange timer hun og Laila Oskarsson har vært i lydstudio for å jobbe med korrekt uttale på enkeltlyder.

– Jeg må innrømme at jeg faktisk ikke trodde dette var mulig da jeg hørte om det første gang. Men heldigvis har vi personer i Divvun og Giellatekno som både kan og vil – og det ferdige produktet er virkelig bra, sier Bals Baal. Hun gleder seg til å ta programmet i bruk allerede til høsten, både på skrivekurs for voksne morsmålsbrukere og på en femårig lærermaster for 5.-10. trinn med nordsamisk som fremmedspråk som en integrert del av utdanningen.

 

Endelig

– Programmet åpner for mange muligheter når det gjelder undervisning, ikke minst for de generasjonene som aldri fikk lese- og skriveopplæring i sitt eget morsmål. Nå kan de endelig få muligheten til å forstå de vanskelige overgangene mellom tekst og tale, sier prosjektleder ved Divvun, Sjur Moshagen. Før undervisning i samisk ble en lovfestet rett på 1990-tallet, gikk tusenvis av samisktalende ut av skolen uten å kunne lese eller skrive morsmålet sitt – nordsamisk. Nå kan de få programmet helt gratis via Sametinget eller UiT. Ved hjelp av et skjermleserprogram kan talesyntesen lese all nordsamisk tekst som er elektronisk – mailer, nettaviser, informasjon fra kommunen eller på sosiale medier.

 

Stor dag

Sametingspresident Aili Keskitalo tror talesyntesen vil bli til stor nytte for enkeltpersoner, næringsliv og institusjoner. Foto: Stig Brøndbo

Også sametingspresident Aili Keskitalo mener tekst-til-tale-programmet vil bli et fantastisk verktøy. Sametinget har finansiert utviklingen av programmet, som har blitt til gjennom et tett samarbeid mellom Sametinget, UiT sine språkteknologiske miljø Divvun og Giellatekno, og svenske Acapela Group AB. Acapela har programmert og digitalisert alle de forskjellige nordsamiske ord- og språklydene. De har også lagt til rette for at talesyntesen skal fungere hos brukere av Microsoft Windows og Apples OS X.

– Det er en stor dag for oss i dag, og jeg tror at dette kommer til å bety mye for enkeltpersoner, næringslivet og for institusjoner, sier sametingspresidenten. Og hun tror at talesyntesen vil gjøre at samisk kan bli et enda mer levende språk blant ungdom.

– Vi strever med å få ungdom til å skrive samisk i sosiale medier. Med mobiltastatur på samisk og talesyntesen på plass, tror jeg at det vil bli mye enklere å bygge nye typer nettverk og kommunisere på samisk, sier Keskitalo.

 

Ikke lett

Veien fra tekst til tale har ikke vært bare enkel for språkteknologimiljøet i Giellatekno og Divvun.

– Samisk har mange flere lyder enn det norske språket, og også på samisk kan ord få forskjellig betydning avhengig av hvilken sammenheng vi bruker dem eller måten vi uttaler dem på. Derfor har det vært veldig viktig å få programmet til å forstå også sammenhengen ordene står i, sier Ritva Nystad, stipendiat ved Institutt for språkvitenskap. Hun har jobbet med å få dataprogrammet til å bruke de samiske enkeltlydene i riktig sammenheng – og hun er fornøyd med resultatet. Det er også stemmens opphav, Laila Oskarsson.

– Men det kan jo hende at jeg blir trøtt av å høre min egen stemme i undervisningen, sier Oskarsson. Heldigvis finnes det en løsning på det også.

– Går jeg lei kan jeg bytte til den mannlige stemmen «Biera», sier hun og ler.

 

Her kan du teste talesyntesen.

Den første snakkemaskinen ble produsert i 1857. Her kan du lese en engelsk Wikipedia-artikkel om den historiske utviklingen av talesynteser.

Brøndbo, Stig
Published: 06.05.15 13:00 Updated: 06.05.15 22:29