Autosegmenteerija 2.0

Selle veebirakendusega saad hääliku tasemel segmenteerida eestikeelset kõnet.

Segmenteerimiseks tuleb üles laadida helifail (wav, vähemalt 16 kHz) ja tekstifail. Tekstifail peab olema UTF-8 kodeeringus. Enne segmenteerimist kustutab süsteem tekstist kirjavahemärgid ja reavahetused. Numbrid ja lühendid peavad olema sõnadeks lahti kirjutatud. Liitsõnad peaks olema plussmärgi või sidekriipuga eraldatud, näit. "mere+kohin". See on vajalik selleks, et liitsõnade hääldus korrektselt kirjapildist tuletada. See on siiski reaalselt vajalik ainult siis, kui liitsõna teine osa algab klusiiliga. Võõrapäraselt hääldatavad nimed peaks samuti olema eestipäraselt translitereeritud (näit. "Marie Curie" -> "Marii Kürii").

Autosegmenteerida saab kuni paari minuti pikkuseid faile (see võib olla sõltuv ka salvestuste kvaliteedist ja kõne laadist). Segmenteerimise resolutsioon on 30 ms.

Segmenteerimise tulemusena saad Praati TextGrid faili. Enamus brausereid peaks selle faili automaatselt alla laadima.

Kui segmenteerimine mingil põhjusel ebaõnnestub, siis näidatakse järgmisel lehel segmenteerimise logi, mis võib anda vihjeid selle kohta, mis valesti läks.

Autosegmenteerimiseks kasutatakse kõnetuvastuse jaoks loodud akustilisi mudeleid, mis on valminud riikliku programmi Eesti Keeletehnoloogia toel. Kui kasutad autosegmenteerijat teadustöös, siis palun viita alljärgnevale publikatsioonile, kus seda kõnetuvastussüsteemi kirjeldatakse:

Tanel Alumäe, Ottokar Tilk, Asadullah. Advanced Rich Transcription System for Estonian Speech. Baltic HLT 2018.