Autoři
Ing. Zoltán Galáž, Ing. Jiří Mekyska, prof. Ing. Zdeněk Smékal, CSc.
Datum vzniku: 3. 11. 2016
Stažení
Software je možné stáhnout zde.
Popis
Tento software slouží k de-identifikaci řeči. Software (SDT) pro de-identifikaci využívá neparametrický přístup, který je založený na tzv. „borcení kmitočtové osy“ (VTLN) spektra řečového signálu. Během VTLN procesu se originální kmitočtová osa mapuje na novou pomocí mapovací (monotónně rostoucí nebo klesající) funkce.
Postup VTLN lze popsat v šesti krocích:
- Řečový signál se rozdělí na segmenty synchronně s hlasivkovými pulzy, tj. každý segment obsahuje jednu periodu znělého úseku řeči. Pro identifikaci hlasivkových pulzů je využit algoritmus „pitch marks“ (W. Goncharoff).
- Každý segment je filtrován Hammingovým oknem.
- Je provedena dopřední diskrétní Fourierova transformace.
- Kmitočtová osa spektra je borcena dle zvolené funkce a tzv. „bortícího faktoru“.
- Je provedena zpětná diskrétní Fourierova transformace.
- Upravené segmenty řeči jsou řetězeny do výsledného signálu pomocí metody PSOLA (Pitch-Synchronous Overlap and Add).
Projekty
Aplikace je výsledkem řešení projektuCOST IC1206. Popsaný výzkum byl realizován v laboratořích podpořených z projektu SIX; registrační číslo CZ.1.05/2.1.00/03.0072, operační program Výzkum a vývoj pro inovace.
Licence
Pro jednání o licenčních podmínkách tohoto softwaru je za VUT pověřen pracovník Centra pro transfer technologií VUT v Brně Ing. Lukáš Novák, Kounicova 966/67a, Veveří, 60200, Brno, Česká republika, novak@ro.vutbr.cz.