Software pro identifikaci a kompresi řeči

Autoři

Ing. Jiří Mekyska, Ph.D., prof. Ing. Zdeněk Smékal, CSc.

Datum

3. listopadu 2016

Popis

Tento software slouží k detekci řečové aktivity a následné kompresi signálu, který obsahuje čistě řečový signál. Algoritmus detekce řečové aktivity je založen na analýze znělých úseků se základním tónem pohybujícím se v rozsahu od 60 do 400 Hz. K odhadu základního tónu byla použita funkce swipep vytvořená Arturem Camachou (http://www.cise.ufl.edu/~acamacho/english/). K následné kompresi byl využit kodek OPUS s parametrem bitrate = 16 kb/s a vzorkovací frekvencí fs = 8 kHz. Tento software poskytuje díky své selektivní a kompresní funkci vysokou úsporu paměti při dlouhodobém logování dat.

vad
compression

Projekty

Aplikace je výsledkem řešení projektu TA04031666. Popsaný výzkum byl realizován v laboratořích podpořených z projektu SIX; registrační číslo CZ.1.05/2.1.00/03.0072, operační program Výzkum a vývoj pro inovace.

Licence

Pro jednání o licenčních podmínkách tohoto softwaru je za VUT pověřen pracovník Centra pro transfer technologií VUT v Brně Ing. Lukáš Novák, Kounicova 966/67a, Veveří, 60200, Brno, Česká republika, novak@ro.vutbr.cz.