La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Voice Activity Detection Based on High Order Statistics and Online EM Algorithm Détection d'activité vocale basée sur des statistiques d'ordre élevé et un algorithme EM en ligne

David COURNAPEAU, Tatsuya KAWAHARA

  • Vues en texte intégral

    0

  • Citer

Résumé:

Une nouvelle méthode de détection d'activité vocale (VAD) en ligne et non supervisée est proposée. La méthode est basée sur une fonctionnalité dérivée des statistiques d'ordre élevé (HOS), améliorée par une deuxième métrique basée sur des pics d'autocorrélation normalisés pour améliorer sa robustesse aux bruits non gaussiens. Cette fonctionnalité est également orientée vers la discrimination entre la parole rapprochée et la parole en champ lointain, fournissant ainsi une méthode VAD dans le contexte d'une interaction interhumaine indépendante du niveau d'énergie. La classification est effectuée par une variante en ligne de l'algorithme d'espérance-maximisation (EM), pour suivre et s'adapter aux variations de bruit dans le signal vocal. Les performances de la méthode proposée sont évaluées sur des données internes et sur CENSREC-1-C, une base de données accessible au public utilisée pour la VAD dans le contexte de la reconnaissance automatique de la parole (ASR). Sur les deux ensembles de tests, la méthode proposée surpasse un algorithme simple basé sur l'énergie et s'avère plus robuste face aux changements de rareté de la parole, de variabilité du SNR et du type de bruit.

Publication
IEICE TRANSACTIONS on Information Vol.E91-D No.12 pp.2854-2861
Date de publication
2008/12/01
Publicisé
ISSN en ligne
1745-1361
DOI
10.1093/ietisy/e91-d.12.2854
Type de manuscrit
PAPER
Catégories
Parole et audition

Auteurs

Mots-clés

Table des matières