Počítače na súdoch sa učia počúvať
BRATISLAVA 29. apríla – Zvýšená vymožiteľnosť práva cestou zrýchlenia a skvalitnenia procesov v justícii, uľahčenie práce úradníkov či zníženie výdavkov na vedenie justičnej agendy, to všetko má za cieľ priniesť revolučná technológia rozpoznávania hlasu. Riešenie pre slovenskú justíciu vyvíja Slovenská akadémia vied a Technická univerzita v Košiciach. Spoločnosť DATALAN v spolupráci s autormi tejto unikátnej technológie pripravuje jeho integráciu do špecializovaných modulov pre tvorbu rozhodnutí a automatizácie justičných procesov.
Unikátny koncept tvorby dokumentov je založený na rozpoznávaní hovoreného slova a jeho hlavným cieľom je zrýchlenie písania dokumentov v jednotlivých krokoch civilného alebo trestného konania. „Ide o významnú inováciu v rámci elektronizácie slovenskej justície a predpokladáme, že už v tomto roku dôjde k praktickému využitiu riešenia,“ hovorí Ľuboš Petrík z divízie rozvojových projektov spoločnosti DATALAN.
Softvérové nástroje na prepis hovorenej reči do textu už v anglicky, či nemecky hovoriacich krajinách existujú, no naprogramovať plnohodnotný softvér na rozpoznávanie hovorenej slovenčiny bolo zložitejšie. Slovenčina je ohybný jazyk, pamätať je preto nutné i na skloňovanie a časovanie. „Ide teda o väčšiu výzvu než predstavujú napríklad anglické aplikácie v mobilných telefónoch,“ dopĺňa Milan Rusko, vedúci oddelenia analýzy a syntézy reči Ústavu informatiky SAV. Kým pri angličtine stačí, aby systém rozoznal necelých 100 000 slov, v prípade slovenského jazyka je to vyše štvornásobok. O to rozsiahlejšie potom musia byť aj rečové a textové databázy, s ktorými softvér pracuje, vrátane ich anotácií. Komplexnejšie sú potom aj výpočty vedúce k relevantnému rozpoznaniu reči a o to väčšia je náročnosť získania relevantných podkladov na vytvorenie potrebných databáz.
V tomto prípade ako podklady pre vytvorenie rečovej a textovej databázy poslúžili prepisy zo zasadaní Národnej rady SR. Tie sú na internete k dispozícii v textovej i zvukovej podobe za obdobie od roku 1994. Navyše, rečníci v parlamente sú zvyknutí hovoriť na mikrofón a jasne artikulovať, čo je pre tvorbu databáz výhodné. Keďže pre vybudovanie plnohodnotného systému nie je možné využiť iba podklady z jediného zdroja, pretože tomu vždy bude chýbať potrebná rôznorodosť, použili sa aj texty z internetu, RSS kanálov či právnické dokumenty. Pri budovaní rečovej databázy sa preto okrem 100 hodín parlamentných prejavov využilo aj 300 hodín ďalších podrobne spracovaných rečových nahrávok. Nasledovalo vytvorenie jazykových a akustických modelov a WFST grafov, ktoré oba modely spájajú do celku vhodného na analýzu a prepis reči. Nevyhnutné bolo aj natrénovanie samotných modelov a rozpoznávača aby dokázal identifikovať nielen jednotlivé slová, ale aj vety a v konečnom dôsledku i celý rečový prejav. „Rýchlosť diktovania už teraz prevyšuje štandardnú rýchlosť písania textu pomocou klávesnice a dosahovaná presnosť prepisu je na úrovni 95%,“ informuje profesor Jozef Juhárz Katedry elektroniky a multimediálnych telekomunikácií FEI TU Košice.
Systém na rozpoznávanie reči navyše nemôže fungovať iba v laboratórnych podmienkach, pripravený musí byť na využitie v bežnom živote. Je preto vytvorený tak, aby sa vedel vysporiadať aj s rušivými vplyvmi akými je napríklad hluk v miestnosti či rečové chyby hovoriaceho. To všetko musí fungovať v zrozumiteľnom a efektívnom používateľskom rozhraní. Nik totiž nebude využívať plnohodnotne softvér, ak jeho ovládanie bude nezrozumiteľné a komplikované.
Aplikačným integrátorom, ktorého úlohou je preniesť riešenie do praxe, je spoločnosť DATALAN. „Riešenie prinesie nielen efektívnejšie a rýchlejšie procesy, ale aj jednoduchší prístup k elektronickému spisu, pričom samozrejmosťou je vysoká miera ochrany a kontroly nad operáciami so spisom“, vysvetľuje Ľuboš Petrík z DATALANu.
V prípade vývoja podobného riešenia pre justíciu odborníci pamätali aj na špecifickú slovnú zásobu a spôsob vyjadrovania bežný na súdoch. Problémom tak nie sú ani špecifické výrazy či skratky typu „hliadka PMJ KR PZ Bratislava“ či „ expertízou KEÚ PZ Bratislava pod č.p.: PPZ-9475/KEU-BA-EXP-2009 bolo zistené…“. Vďaka tomu je vyvíjaný systém rozpoznávania reči výhodný nielen pre justíciu a súdne konania, ale aj pre advokátov a notárov. Všetkým účastníkom súdnych konaní dokáže šetriť nielen čas, ale aj peniaze.
Všetky funkcionality systému majú spoločné menovatele: urýchľujú a zjednodušujú prácu, šetria peniaze a zvyšujú efektivitu nielen súdov, ale aj advokátskych kancelárií či notárskych úradov. Sú jednoznačnými krokmi vpred v procese digitalizácie justície, ktorá by mala v konečnom dôsledku viesť k tomu, aby Slovensko nepatrilo v oblasti vymožiteľnosti práva už chronicky k tým najhorším na svete.
O spoločnosti DATALAN, a.s.
Spoločnosť DATALAN pôsobí na slovenskom trhu od roku 1990 a v súčasnosti je popredným poskytovateľom informačných technológií na Slovensku a v okolitých krajinách. Dôkazom toho je ocenenie IT firma roka, 3. miesto v kategórii Firma roka TREND TOP 2010 a najvýznamnejšie partnerské ocenenia medzinárodných IT spoločností. Hlavnými oblasťami pôsobenia spoločnosti DATALAN sú infokomunikácie, softvér, outsourcing a cloud. Vďaka skúsenému tímu odborníkov, ktorí sú držiteľmi viac než 600 platných odborných certifikátov, spoločnosť úspešne zrealizovala mnohé rozsiahle projekty v oblasti správy dokumentov a informácií, riadenia procesov a spolupráce, optimalizácie IT infraštruktúry, outsourcingu IT a dodávok hardvéru. Prioritou spoločnosti DATALAN je zodpovedné podnikanie a kvalita poskytovaných riešení a služieb, čo potvrdzujú aj európske certifikáty manažérstva kvality ISO 9001:2008, ISO 14001:2004, OHSAS 18001:2007 a ISO/IEC 27001:2005.
PR Servis je komerčný informačný servis určený na publikovanie tlačových správ, informácií, vyhlásení a oznamov určených médiám a verejnosti. Texty sú vysielané v znení, dodanom klientom, bez redakčnej úpravy. Agentúra SITA je distribútorom týchto informácií a za ich obsahovú a štylistickú úroveň nezodpovedá. E-mail: prservis@sita.sk.