pátek 8. listopadu 2013

Vnímavý písař

Testoval jsem ruský program RealSpeaker, který slouží k "audio-video" rozpoznávání řeči a její převod na text. Pracuje jako nadstavba webové služky Google, která rozpoznává zvukovou složku, a RealSpeaker získané výsledky upřesňuje pomocí "odezírání" - snímá a analyzuje pohyby rtů, otevírání a zavírání úst a pohyb jazyka v otevřených ústech. Nadiktovaný text pak vkládá přímo do libovolného textového pole jakékoliv aplikace ve Windows 7 a vyšších nebo v OS Android.

Praktické zkušenosti s verzí 1.4

Pro první test jsem použil RealSpeaker 1.4 a kameru Logitech HD Webcam C270. Pro správné fungování je samozřejmě potřebný dostatečně kvalitní obraz. Kromě kamery má velký vliv i osvětlení. Pokud jsem si lampičkou více osvítil ústa, bylo rozpoznávání přesnější.

Program nenabízel možnost diktovat český text (rozhraní bylo možné nastavit do 11 různých jazyků a pro diktování rozpoznával 12), takže jsem testoval diktování anglického a ruského textu.



Software nejprve zaměří moji hlavu a "zírá" na moje ústa, což je vidět na dvou rámečcích, které se automaticky přizpůsobují pohybům hlavy. Získaná obrazová data používá pro přesnější identifikaci existujících frází.



Použití RealSpeakeru by mělo proti samotnému audio rozpoznávání Googlu zvýšit přesnost rozpoznávání řeči přibližně z 90% na 95%, ale podrobné srovnání jsem nedělal, protože jsem chtěl počkat na následující verzi, která měla podporovat i rozpoznávání češtiny.

Nepraktické zkušenosti s verzí 1.5


Srovnání nastavení ve verzi 1.4 a 1.5

Služba Googlu podporuje rozpoznávání mnoha dalších jazyků, a tak byla ve verzi 1.5 ruční volba jazyka odstraněna (její místo v menu obsadila volba Seznam hlasových příkazů) a program by měl pravděpodobně přebírat jazyk klávesnice nastavené v operačního systému, což přepne jazyk, ve kterém se program zobrazuje. Bohužel se jedná pouze o strojový překlad, takže obsahuje řadu nepřesností.



Ukázka anglického příkazu a jeho překladu do češtiny

Uživatelské rozhraní se už tedy zobrazuje česky i polsky, ale to nejdůležitější je diktování a diktovat v těchto jazycích bohužel nelze. To je zřejmě stále možné pouze v jazycích, které byly na výběr v předchozí verzi.

Pro české uživatele je tedy program RealSpeaker v současnosti stále nepoužitelný a lepší alternativou zůstává webová aplikace Dictanote.co.

Žádné komentáře:

Okomentovat