Software pro de-identifikaci řeči

Autoři

Ing. Zoltán Galáž, Ing. Jiří Mekyska, prof. Ing. Zdeněk Smékal, CSc.

Stažení

Software je možné stáhnout zde.

Popis

Tento software slouží k de-identifikaci řeči. Software (SDT) pro de-identifikaci využívá neparametrický přístup, který je založený na tzv. „borcení kmitočtové osy“ (VTLN) spektra řečového signálu. Během VTLN procesu se originální kmitočtová osa mapuje na novou pomocí mapovací (monotónně rostoucí nebo klesající) funkce.

Postup VTLN lze popsat v šesti krocích:

  1. Řečový signál se rozdělí na segmenty synchronně s hlasivkovými pulzy, tj. každý segment obsahuje jednu periodu znělého úseku řeči. Pro identifikaci hlasivkových pulzů je využit algoritmus „pitch marks“ (W. Goncharoff).
  2. Každý segment je filtrován Hammingovým oknem.
  3. Je provedena dopřední diskrétní Fourierova transformace.
  4. Kmitočtová osa spektra je borcena dle zvolené funkce a tzv. „bortícího faktoru“.
  5. Je provedena zpětná diskrétní Fourierova transformace.
  6. Upravené segmenty řeči jsou řetězeny do výsledného signálu pomocí metody PSOLA (Pitch-Synchronous Overlap and Add).

Projekty

Aplikace je výsledkem řešení projektuCOST IC1206. Popsaný výzkum byl realizován v laboratořích podpořených z projektu SIX; registrační číslo CZ.1.05/2.1.00/03.0072, operační program Výzkum a vývoj pro inovace.

Licence

Pro jednání o licenčních podmínkách tohoto softwaru je za VUT pověřen pracovník Centra pro transfer technologií VUT v Brně Ing. Lukáš Novák, Kounicova 966/67a, Veveří, 60200, Brno, Česká republika, novak@ro.vutbr.cz.