Ondro

V polovici leta sa objavila prvá verzia nového slovenského hlasu. Ondro je pomerne rýchly a stabilný, rešpektuje pravidlá slovenskej a základnej českej výslovnosti, nepokúša sa interpretovať ani skratky, ani anglické slová, dostupný je pre NVDA, Sapi5 a Linux. 

Za jeho zrodom stoja Peter Vágner a Ondrej Rosík, prvými testermi boli Peter Lecký, Marek Macko a Peter Nedorost.

 

„Motivácie boli dve. Zvedavosť, či by sme vôbec niečo také zvládli, a správa, ktorá sa objavila na česko-slovenskej konferencii Fanda: „Ahojte, urobil som český hlas.“ Podpis: Zvonimir Stanečić. Vedel som, že nevidiaci Poliaci si hlasy vytvárajú sami a že ich dávajú k dispozícii aj ostatným, ale toto bol nejaký lingvistický nadšenec z Chorvátska. A vtedy sme si s Peťom povedali, že keď to zvládol niekto, pre koho nie je čeština materinským jazykom, bol by v tom čert, aby sme my dvaja nezvládli slovenčinu,“ hovorí o začiatkoch Ondrej Rosík. „Pochopili sme, že keď chceme počítač naučiť rozprávať, musíme ho nakŕmiť nahrávkami s načítaným textom a nechať mu čas, aby to, takpovediac, pochrúmal. Ale na to, aby to aj strávil, sme potrebovali pravidlá slovenskej gramatiky a tie v požadovanej podobe neexistovali.“

A tak sa Peter Vágner pustil do ich prípravy. Vysvetlil systému spodobovanie, zmäkčovanie, definoval výnimky (aby napr. telefóny, televízie, telekomunikácie či telemetrie čítal tvrdo), nahral databázu symbolov a bližšie sa prizrel ovládaniu programu (RH Voice beží pod Linuxom a celý sa ovláda z príkazového riadku). Ondrej Rosík sa zatiaľ oboznamoval s tým, aké texty a nahrávky musia dodať.

Na to, aby sa Ondro naučil rozprávať po slovensky, potreboval vyše 3500 fráz. Väčšina pochádzala z databázy Common Voice, zvyšok z Ondrejových článkov a Slovenského národného korpusu. Načítavali sa však aj jednotlivé písmená (okrem tých, ktoré sa používajú v slovenčine, aj ř a ě).

„Ono je v podstate jedno, aký text počítač dostane. Jednotlivé vety spolu nemusia nijako súvisieť, dokonca nemusia ani dávať zmysel,“ pokračuje Ondrej Rosík. „Ak by ale systém nikdy nepočul f, jednoducho by ho nepoznal a nenaučil sa ho vysloviť, ak by ho v nahrávkach zachytil len občas, mohol by si ho zafixovať nesprávne. Každá hláska preto musí zaznieť často, rovnako, v rovnakej frekvencii a s rovnakou intonáciou. Ale v rôznych kombináciách. Inak by nevedel, že ts sa v slovenčine číta ako c, žš ako dlhšie š a podobne.

Systému som vštepoval aj to, že za interpunkčnými znamienkami u nás nasleduje krátka pauza. Dával som si pozor, aby zachytil naozaj ticho a nie napr. môj nádych, aby náhodou nevyhodnotil, že v slovenčine je tento zvuk súčasťou výslovnosti čiarky alebo bodky. Ja som to dal na jeden nádych, ale ono sa to dá vystrihnúť, príp. to zveriť technike (efektom či mikrofónu). A, pravdaže, pri nahrávaní by nemalo byť echo, aby bol zvuk naozaj čistý. Moja manželka Ivka mi preto zakaždým postavila z matracov a deky bunker, kde som si vliezol a pracoval.“

 

Výzvy budúcnosti

„Je to príjemné,“ odpovedá mi Ondrej Rosík na otázku, aké to je počúvať z počítača a mobilu vlastný hlas. „Ale ja som na to zvyknutý, v rádiu to inak ani nejde – stojím na chodbe, sprava sa zo štúdia vysiela nejaká moja relácia, zľava kolega strihá tú, ktorá pôjde zajtra. V počítači som si ale hlas jemne stmavil, viac sa mi páči posadený trošku nižšie. Dobre sa mi s ním čítajú správy, ale na beletriu sa mi to kvôli intonácii akosi nehodí. Mne sa síce zdalo, že tie vety nahrávam dostatočne prirodzene, ale systém ma nejako sploštil. Ideálne by bolo, keby vnímal kontext a podľa toho s textom pracoval. Je to hudba budúcnosti, ale podľa mňa nie až takej vzdialenej. Syntéza, ktorá využíva umelú inteligenciu, už existuje, zatiaľ je ale jej použitie obmedzené – funguje v menej používaných systémoch a neraz bojujeme s dlhou odozvou, prehrievaním počítača a pod.“

 

Buďte aj vy syntetickí!

Ak by ste si chceli vytvoriť syntézu z vlastného hlasu, zájdite na web hlas.ondrosik.sk. Nájdete tam inštalačné súbory, inštrukcie i ukážky, s technickou stránkou vám môžu pomôcť sami tvorcovia. Priamo na hlas požiadavky nie sú, treba ale počítať s tým, že systém vás napodobní naozaj verne – vo výsledku teda môže ráčkovať, šušlať či fufňať. Dôležité je, aby nahrávky boli konzistentné, t. j. aby ste nenačítavali texty, keď ste zachrípnutí. Od kvality nahrávky závisí, či budete znieť viac synteticky alebo autenticky.

„Zaviazali sme sa udržiavať Ondra pri živote, to znamená, dbať o to, aby bol kompatibilný po každej aktualizácii. Ak teda urobíme nejakú zmenu, v Androide sa to prejaví automaticky, v prípade Jawsu a NVDA to ale bude potrebné nahodiť nanovo. Keď sa ale niečo zásadné udeje, určite na to upozorníme v sekcii Novinky na hlas.ondrosik.sk, prostredníctvom Blindrevue, Blindandroid, konferencie Fanda (ale aj iných), takisto cez facebookovú skupinu Nevidiaci a slabozrakí, koľko je nás v skutočnosti?, notifikácie v mobiloch a pod. Boli by sme radi, keby sa ten hlas dostal aj do iných pomôcok alebo aj do Robobraille. V súčasnosti sa usilujeme nadviazať spoluprácu s viacerými výrobcami či prevádzkovateľmi, aby sme získali informácie, ako pre nich upraviť technické parametre,“ uzatvára Ondrej Rosík.

 

Dušana Blašková

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *