Regeringsuppdrag att främja utveckling av en nationell språkinfrastruktur för talbaserade tjänster

Det finns behov av infrastruktur för att främja talteknologi i Sverige
Utveckling av talteknologi och talbaserade tjänster går snabbt framåt, och taligenkänning anses idag vara en standardteknik. Däremot sker utvecklingen av talteknologiska applikationer huvudsakligen på kommersiellt mer attraktiva språk än svenskan, såsom engelska och spanska. Detta kan leda till att den tekniska innovationen inom talteknologi på svenska begränsas eller helt avstannar.

För att det svenska språket ska prioriteras vid talteknikutveckling och att befintliga talbaserade tjänster ska bli användbara för bland annat personer med funktionsnedsättning, krävs en nationell satsning på talteknologi. Detta är nödvändigt om Sverige vill kunna ta en framträdande roll som en innovativ nation med en hög utvecklingstakt av talbaserade tjänster. Dessutom domineras den svenska talteknologimarknaden idag av ett fåtal amerikanska bolag.

En lösning på behovet att skapa en nationell språkinfrastruktur för talbaserade tjänster är att etablera en digital samlingsplats av talresurser, även kallad en talresursbank. Talbaserade tjänster som i framtiden kan nyttja en talresursbank är allt ifrån personliga assistenter såsom Apples Siri eller Google Assistant till skuggtalarsystem för direkttextning av tv-program.

KTH har skapat grunden till en talresursbank

För att skapa en talresursbank har Kungliga Tekniska Högskolan (KTH), på uppdrag av PTS, inventerat den svenska talteknologiska marknaden och skapat grunden till en öppen nationell talresursbank. KTH har även inrättat ett taligenkänningssystem av öppen källkod som är kopplat till talresursbanken, vilket möjliggör att även personer utan stor teknisk talteknologiexpertis kan nyttja talresurserna.

PTS har även, via det oberoende konsultbolaget The Boston Consulting Group, utrett nio potentiella förvaltare av en framtida talresursbank och kommit fram till att Svensk Nationell Datatjänst (SND) är mest lämpade. SND föredras huvudsakligen på grund av sitt tydliga förvaltningsintresse, erfarenhet av metadatahantering, sitt aktiva deltagande i en rad internationella organisationer samt SND:s neutralitet på marknaden.

En prototyp har utvecklats för att utreda skuggtalarteknik på svenska

För att svara på hur väl taligenkänning fungerar som direkttextningsmetod har PTS, tillsammans med Sveriges Television (SVT), upphandlat en prototyp för direkttextning av tv-program med hjälp av skuggtalarteknik. Uppdraget avslutades med en utvärderingsstudie som visar att taligenkänning är ett fungerande alternativ för direkttextning och att skuggtalarteknik fungerar väl för det svenska språket.

Utvärderingen visar även att slutanvändare, inklusive personer med funktionsnedsättning, uppskattar den nya tekniken och att användandet av skuggtalarteknik kan innebära vissa positiva effekter för ett programbolag. Exempelvis är utbildningen av nya skuggtalare betydligt kortare än utbildningen för befintliga tekniker. Detta medför en ökad flexibilitet för tv-bolag som snabbare kan ta in nya resurser vid exempelvis resursbrist eller semestrar.

PTS två förslag för främjandet av talbaserade tjänster i Sverige

Det första förslaget som läggs fram i rapporten baseras på att det idag råder en brist på infrastruktur för talresurser på det svenska språket. PTS anser att detta behov kan tillfredsställas vid finansiering av en öppen nationell talresursbank. Rapportens förslag är att SND bör förvalta talresursbanken och initialt erhålla 5-8 miljoner kronor per år i en tvåårig implementeringsfas och sedan 4-6 miljoner kronor årligen. Finansieringen bör vara i form av ett statligt anslag för att garantera oberoende och öppet nyttjande.

PTS förslag är även att införa ett forskningsråd och ett expertråd som tillsammans ansvar för riktning och strategi för talresursbanksförvaltaren. KTH föreslås vara samordnare för forskningsrådet och Institutet för språk och folkminnen föreslås vara samordnare för expertrådet.

Det andra förslaget som läggs fram i rapporten baseras på att taligenkänning är ett fungerande alternativ för direkttextning. PTS förslag är att programbolag i Sverige bör överväga skuggtalarteknik som textningsmetod, både förinspelat och direktsänt. För att underlätta övergången från dagens tekniker till skuggtalarteknik kan det även vara rimligt för staten att stimulera fortsatt utveckling av skuggtalarteknik.

Detta skulle i slutändan gynna slutanvändarnas möjligheter att få en större del av programutbudet textat. Ytterligare en fördel är att talresursbanken skulle få fler talresurser från sådana taligenkänningsprojekt. Förutsatt att programbolagen då överför skapade talresurser till talresursbanken. Slutligen är PTS positiva till SVT:s intentioner att fortsätta arbetet med att utveckla skuggtalarteknik för att dels testa fler genrer och dels genomföra reella textningsprojekt som visas inför publik.

 

Här hittar du PTS slutrapportering av regeringsuppdraget att främja utveckling av en nationell språkinfrastruktur för talbaserade tjänster.

Till denna hör även följande bilagor:

Bilaga 1 - Språkresursbank - teknik och omvärld
Bilaga 2 - Nationell språkresursbank
Bilaga 3 - Nyttjande av offentligt tillgängliga svenska talresurser i en nationell talresursbank
Bilaga 4 - Skapandet av grunden för en svensk talbank
Bilaga 5 - Förvaltning, finansiering och strategi för en framtida talresursbank
Bilaga 6 - Utvärdering av SVTs prototyp för skuggtalarteknik
Bilaga 7 - Taligenkänning på SVT
Bilaga 8 - Redovisade kostnader för regeringsuppdraget