La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

An Adaptive Wavelet-Based Denoising Algorithm for Enhancing Speech in Non-stationary Noise Environment Un algorithme de débruitage adaptatif basé sur des ondelettes pour améliorer la parole dans un environnement sonore non stationnaire

Kun-Ching WANG

  • Vues en texte intégral

    0

  • Citer

Résumé:

Les algorithmes traditionnels d'amélioration de la parole basés sur les ondelettes sont inefficaces en présence d'un bruit hautement non stationnaire en raison des difficultés liées à l'estimation précise du spectre de bruit local. Dans cet article, une méthode simple d'estimation du bruit utilisant l'utilisation d'un détecteur d'activité vocale est proposée. Nous pouvons améliorer le résultat d'un algorithme d'amélioration de la parole basé sur des ondelettes en présence de salves de bruit aléatoires en fonction des résultats de la décision VAD. La parole bruyante est d'abord prétraitée à l'aide d'une décomposition de paquets d'ondelettes à l'échelle de l'écorce ( BSWPD ) pour convertir un signal bruyant en coefficients d'ondelettes (WC). Il s’avère que le paramètre VAD utilisant l’entropie spectrale à l’échelle de l’écorce, appelé BS-Entropie, est supérieur aux autres approches basées sur l’énergie, en particulier en termes de niveau de bruit variable. Le seuil de coefficient d'ondelette (WCT) de chaque sous-bande est ensuite ajusté temporellement en fonction du résultat de l'approche VAD. Dans une trame dominée par la parole, la parole est classée soit en une trame voisée, soit en une trame non voisée. Une trame voisée possède un fort spectre de type tonalité dans les sous-bandes inférieures, de sorte que les WC de la bande inférieure doivent être réservés. Au contraire, le WCT a tendance à augmenter dans la bande inférieure si la parole est classée comme non voisée. Dans une trame dominée par le bruit, le bruit de fond peut être presque complètement supprimé en augmentant le WCT. Les résultats expérimentaux objectifs et subjectifs sont ensuite utilisés pour évaluer le système proposé. Les expériences montrent que cet algorithme est valable sur diverses conditions de bruit, notamment pour le bruit de couleur et les conditions de bruit non stationnaire.

Publication
IEICE TRANSACTIONS on Information Vol.E93-D No.2 pp.341-349
Date de publication
2010/02/01
Publicisé
ISSN en ligne
1745-1361
DOI
10.1587/transinf.E93.D.341
Type de manuscrit
PAPER
Catégories
Parole et audition

Auteurs

Mots-clés

Table des matières