Jonas Beskow är professor i talkommunikation på Kungliga Tekniska Högskolan (KTH). Att det är svårt för datorer att härma mänskligt tal och kanske framförallt uttala egennamn och ortsnamn har flera orsaker.
– Det finns avancerade system som används idag som kan härma mänskligt tal riktigt bra men de är dyra och oftast inte de man väljer att använda för till exempel hållplatsutrop eller som talande telefonväxlar, säger han. Det är en anledning till att det kan låta konstigt.
Svåra språk
En annan anledning är att vissa språk är svårare än andra för datorer att lära sig med hjälp av skriven text.
Språk som svenska, franska och engelska innehåller till exempel stavelser och ljud som står utskrivna i skrift men som som är stumma i vissa kombinationer. Ibland bildar också vissa bokstäver helt egna ljud som sje-ljuden i svenskan.
Tydlig koppling till skriftspråk
Då är det enklare för en dator med finska.
– Finska har en väldigt tydlig koppling mellan skriftspråk och uttal, konstaterar Jonas Beskow. Det är nästan exakt så att allt som skrivs också ska uttalas så som det står skrivet.
”Då faller illusionen”
Men inte det mest avancerade talprogrammet är bättre än en människa när det gäller att uttala egennamn eller låneord som vissa språk infört.
– Då faller illusionen att datorer ska vara så intelligenta och att AI kommer att ta över allting, säger Jonas Beskow, när de inte ens kan uttala enkla ord. Men så är det, datorer är egentligen väldigt dumma och kan bara det som de har tränats på och träningen står vi människor för.