Pressemeddelelse fra Alexandra Instituttet
Det globale marked for taleteknologi vil vokse med 16-19 procent årligt de næste fem år, viser undersøgelser fra blandt andet Fortune Business Insights. Desværre halter det danske marked i øjeblikket bagud, fordi det er for ressourcekrævende at udvikle dansk taleteknologi for den enkelte virksomhed.
Det er ærgerligt, fordi dansk erhvervsliv går glip af god forretning, og samfundet snydes for innovative løsninger, der for eksempel kan anvendes i hjælpemidler til ældre og borgere med synshandicap eller effektiviseringer i det offentlige. Det skal et nyt forsknings- og innovationssamarbejde mellem Alvenir, Corti, Digitaliseringsstyrelsen, Københavns Universitet og Alexandra Instituttet nu rette op på.
Taleteknologi skal gøres tilgængelig for alle
Projektet skal udvikle et taledatasæt med navnet Danish Conversational and read-aloud speech dataset (CoRal). Datasættet vil indeholde 1000-1500 timers samtale og oplæst tale fra et bredt og repræsentativt udsnit af befolkningen i forhold til køn, alder, danske dialekter og udenlandske accenter. Samtidig skal der udvikles sprogmodeller, der kan genkende dansk tale og læse dansk tekst højt.
I øjeblikket har dansk taleteknologi nemlig svært ved at forstå kvinder, ældre, dialekter og accenter. Og for at taleteknologi kan bruges i for eksempel voicebots og stemmestyrede hjælpemidler, er det nødvendigt, at det virker for alle borgere. Det er således ikke kun et økonomisk potentiale, der skal indfris; det er også et demokratisk deficit, der skal indhentes.
Open source gavner virksomheder og samfundet
“Taleteknologi kan skabe enorm værdi, både for dansk erhvervsliv og for vores samfund som helhed,” spår Jens Kaas Benner, Head of AI and Data Analytics Lab på Alexandra Instituttet.
“Når vi gør danske datasæt og sprogmodeller gratis tilgængelige, bliver det pludselig let for virksomhederne at komme i gang med at udvikle og bruge løsninger, der ‘forstår’ talesprog. Og det offentlige kan blive aflastet, når for eksempel dokumentation og sundhedsjournaler kan automatiseres,” siger han.
Alle data og modeller bliver testet og offentliggjort løbende, så udviklere, virksomheder og offentlige institutioner kan drage nytte af dem fra start. Alexandra Instituttet står sammen med Digitaliseringsstyrelsen i første omgang for rekrutteringen af talere fra hele landet og opfordrer især kvinder, ældre og borgere, der taler med accent eller dialekt til at melde sig. Bred rekruttering af talere er nemlig en forudsætning for projektets succes.
Kontakt
Projektleder Kasper Fænø Bay Noer, Senior Digital Strategist på Alexandra Instituttet
Tlf. 26 83 80 44
.Fakta: Hvad kan træfsikker dansk taleteknologi bruges til?
- Stemmestyrede hjælpemidler til f.eks. ældre, borgere med synshandicap eller særlige behov
- Diktat af sundhedsjournaler eller automatisk dokumentation af samtaler med borgere/kunder
- Voice-/chatbots til bl.a. it-hjælp som nulstilling af passwords, navigation på hjemmesider, etc.
- Bedre maskinoversættelse mellem dansk og andre sprog
- Bedre digital oplæsning i f.eks. GPS eller i offentlig transport
- Beslutningsstøtte med relevant viden til medarbejdere
Fakta om projektet
Innovationsfondens investering: 14.217.380 mio. kr.
Samlet budget: 22.172.400 mio. kr.
Varighed: 2 år og 10 måneder
Officiel titel: Danish Conversational and read-aloud speech dataset (CoRal)
Dansk hjemmeside:
Engelsk hjemmeside:
Om partnerne
Alexandra Instituttet er Danmarks eneste Godkendte Teknologiske Service-institut specialiseret i IT og digitalisering. Instituttet er sat i verden for at sikre, at de nyeste digitale teknologier bliver gjort tilgængelige for dansk erhvervsliv og det danske samfund som helhed.
Alvenir er en dansk spin-out virksomhed fra DTU som arbejder domænespecialiseret talegenkendelse til b.la. dokumentation af finansielle rådgivningssamtaler. Derudover spiller Alvenir en aktiv rolle i det danske open-source-miljø, og har siden virksomhedens stiftelse bidraget med både sprogmodeller og dataressourcer.
Corti er en dansk virksomhed, der har udviklet tale-, lyd-, og tekstbaseret AI-software til at assistere patientbehandling og dokumentation i sundhedssektoren. Med den banebrydende AI-software nedbringer Corti tiden samt højner kvaliteten af den enkelte patientinteraktion. Cortis software nærmer sig 100 millioner interaktioner om året i Skandinavien og engelsktalende lande, primært USA.
Datalogisk Institut på Københavns Universitet (DIKU) er Danmarks ældste og førende datalogiske institut. DIKU forsker og underviser inden for de tre hjørner af datalogi – algoritmer, mennesker og data – og instituttet deltager aktivt i udviklingen af teknologisk innovation i samfundet gennem en lang række samarbejder.
Digitaliseringsstyrelsen udformer og implementerer digitaliseringsinitiativer i den offentlige sektor. Styrelsen understøtter effektivitet og fleksible digitale services via løsninger til borgere, private virksomheder og offentlige myndigheder. For at understøtte udviklingen af danske sprogteknologiske løsninger, så har regeringen, KL og Danske Regioner udviklet sprogteknologi.dk, som skal give let adgang til danske sprogressourcer.
Læs hele pressemeddelelsen på Via Ritzau her:
** Ovenstående pressemeddelelse er videreformidlet af Ritzau på vegne af tredjepart. Ritzau er derfor ikke ansvarlig for indholdet **