Eurostars skiria 1 mln. eurų finansavimą dirbtinio intelekto audioknygoms

AAI Labs vadovaujamas tarptautinis konsorciumas buvo atrinktas gauti viešąjį finansavimą pagal neseniai paskelbtą "Eurostars" kvietimą. Partneriai siekia sukurti išsamų dirbtiniu intelektu valdomą audioknygų kūrimo rinkinį, kuriame leidėjai galės pigiau gaminti audioknygas, išlaikydami aukštą pasakotojo balso kokybę.

Konsorciumo komandą sudaro mašininio mokymosi įmonė AAI Labs (Lietuva), tarptautinius apdovanojimus pelniusi Pietų Afrikos Respublikos leidykla "Quickfox Publishing" ir pirmaujanti Kroatijos naujosios žiniasklaidos ir elektroninių knygų leidykla "Bulaja Naklada".

Projekto metu bus sukurta nebrangi, daugiakalbė, aukštos kokybės pusiau automatizuota garso knygų kūrimo sistema, pagrįsta itin tiksliais teksto į kalbą (TTS) dirbtinio intelekto sintezės algoritmais. Partneriai planuoja atlikti tyrimus, siekdami sukurti TTS sistemą, kuri leistų perkelti balso ypatybes (vaikų balsus, užsienio akcentus) iš vienos kalbos į kitą, taip užtikrinant teatralizuotą naudotojo patirtį.

Pasaulyje audioknygos sudaro apie 6 proc. visos knygų rinkos, kuri kasmet auga, nes vis daugiau žmonių mieliau klausosi knygų. Tačiau dauguma parašytų kūrinių nėra prieinami garso formatu dėl didelių pasakojimo ir gamybos sąnaudų.

"Atsižvelgiant į išmaniųjų prietaisų, turinčių transliacijos galimybes, paplitimą, audioknygų rinka yra didžiulė. Neseniai įvykęs proveržis natūralios kalbos apdorojimo srityje leidžia sintetinti kalbą taip, kad ji prilygtų žmogaus kokybei. Šiuo būdu sumažinus audioknygų gamybos sąnaudas ir populiarinant mažiau žinomų leidėjų ir autorių literatūrą, tai bus naudinga gyventojams, nes paskatins daugiau žmonių skaityti klausantis", - sako AAI Labs generalinis direktorius Aistis Raudys.

Į dirbtiniu intelektu pagrįstą metodą, kurį siekia sukurti partneriai, įeina tik teksto parengimas, TTS technologijos taikymas ir įvaldymas po gamybos, todėl pasakojimo darbai ir garso inžinerija tampa nereikalingi. Bendras gamybos laikas sutrumpės nuo kelių savaičių iki vos valandos, darant prielaidą, kad reikės nedaug postprodukcijos.

TTS technologiją daugiausia bus siekiama taikyti tose srityse, kuriose audioknygų gamyba tradiciniais metodais yra nepelninga. Tai išplės vartotojų prieigą prie įvairesnės literatūros, įskaitant medžiagą, skirtą vietiniams gyventojams, mažumų grupėms ir nišinėms rinkoms, o visa tai dėl dirbtinio intelekto padarys teigiamą poveikį visuomenei.

"Pigesnė produkcija reiškia, kad leidėjai ir pedagogai gali išleisti daugiau audioknygų besivystančiose šalyse, kur raštingumas dažnai yra žemas, tačiau dabar lengvai prieinami mobilieji įrenginiai. Tai gali pakeisti situaciją, kai mases žmonių galima pasiekti kalba ir formatu, kurį jie gali lengvai pasiekti jau turimais įrenginiais", - aiškina leidyklos "Quickfox Publishing" leidybos direktorė Vanessa Wilson.

Tai ypač aktualu Afrikos šalyse, kuriose, Afrikos plėtros banko duomenimis, 2021 m. raštingumas sieks 67,4 %, tačiau mobiliojo ryšio paslaugomis naudojasi apie 650 mln. vartotojų.

"Dauguma TTS tyrimų buvo atliekami naudojant 22050 Hz diskretizavimo dažnio įrašus. Tokia kokybė yra nepakankama daugumai garsinių knygų leidėjų, nes 44100-4800 Hz diskretizavimo dažnis yra pramonės standartas. Jau turime patirties, kaip sėkmingai kurti TTS sistemas, palaikančias tokios aukštesnės kokybės garsą. Tai suteikia mums pranašumą prieš audioknygų leidybos įmones, nes kokybės reikalavimai bus patenkinti", - teigia Tadas Subonis, AAI Labs techninis direktorius.

Tikimasi, kad projektas bus baigtas iki 2025 m., o garso knygų kūrimo rinkinį galės įsigyti leidyklos ir kitos žiniasklaidos įmonės.

"Eurostars" yra didžiausia tarptautinė finansavimo programa, skirta MVĮ, norinčioms bendradarbiauti vykdant MTTP projektus, kuriais kuriami inovatyvūs produktai, procesai ar paslaugos, skirti komercializuoti, ir kuri yra Europos novatoriškų MVĮ partnerystės dalis. Partnerystę bendrai finansuoja Europos Sąjunga per programą "Europos Horizontas".

Previous
Previous

Pokalbis apie inovatyvius faktoringo sprendimus

Next
Next

Naujas projektas, skirtas viešojo transporto srautams prognozuoti naudojant dirbtinį intelektą