Nesten 7000 setninger måtte leses inn før Aftenposten fikk sin egen AI-stemme i lydartikler
– Ekte stemmer er fortsatt best, men vi tror dette vil høres annerledes ut om noen år,
(BERGEN): Tidligere i år gjorde Aftenposten det mulig for brukerne å lytte til artikler, fremfor å lese dem.
Under Nordiske Mediedager forklarte produktdirektør for Schibsteds abonnementsaviser i Norge og Sverige, Karl Oskar Teien, om Aftenposten-satsingen med bruk av AI fra tekst til lyd.
– Vår ambisjon er å gjøre det like lett å lytte til artikler, som å lese artikler, sier Teien.
Krevende arbeid
I flere av dagens Aftenposten-artikler finnes det en avspillingsknapp, og trykker man på denne får man artikkelen lest opp, med Anne Lindholm sin stemme.
Hun har vært programleder for flest episoder av Aftenposten-podkasten, Forklart.
– Det virker kanskje rart at vi ikke gjør det med absolutt alt innhold, men det kreves en betydelig innsats.
Innleste artikler koster tid og ressurser, samt korreksjon av språket.
– For å få Lindholms stemme måtte hun lese inn 6812 setninger, som tok 34 timer i studio og sto for et konsum av 21 kopper kaffe.
Deep fuck news
Tekst-til-tale eknologien heter «BeyondWords».
– Det er tidkrevende arbeid, og det er ikke perfekt ennå. Vi har møtt på noen uheldige tolkninger, som er gode eksempler på dette.
Blant annet ble «Deep fake news» til «Deep fuck news», og «Martin Luther King Jr.» ble til «Martin Ludder King Jr.».
– Det er jo ikke helt heldig, men heldigvis kan vi raskt avpublisere eller endre slike tolkninger. Og vi opplever at brukerne har stor forståelse og sympati for disse utfordringene, forklarer produktdirektøren.
Bruken av lyd vokser mest blant de yngste, og mange foretrekker å konsumere nyheter på øret. Så langt erfarer Schibsted at antallet som bruker tekst-til-tale øker jevnt.
– Dette verktøyet handler først og fremst om fremtidens brukere og vi ser at innhold som treffer yngre gir mer lytting.
Teien forteller at brukere som lytter fullfører mer av artikkelen og at lydartikler har dobbelt så høy gjennomføringsgrad som de skrevne.
Mye vil skje på kort tid
Ifølge Dysleksi Norge har cirka fem prosent av befolkningen dysleksi.
– Mange har begrensninger som gjør at lytting passer bedre og vi samarbeider med flere organisasjoner for å lære hvordan vi kan tilpasse lydinnhold best mulig.
Men det er ikke bare positive reaksjoner til lydartikler. Det som trekkes fram er at det lest innholdet ofte har et preg av en gebrokken stemme.
– Ekte stemmer er fortsatt best, ingen tvil om at vi fortsatt har et langt stykke å gå, men vi tror dette vil høres annerledes ut om noen år, og at AI kan hjelpe oss å konvertere og gjøre en sak mer lydvennelig på kort tid.