La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Speech Enhancement: New Approaches to Soft Decision Amélioration de la parole : nouvelles approches de la décision douce

Joon-Hyuk CHANG, Nam Soo KIM

  • Vues en texte intégral

    2

  • Citer

Résumé:

Dans cet article, nous proposons de nouvelles approches d'amélioration de la parole basées sur la décision douce. Afin d'améliorer la fiabilité statistique de l'estimation de l'activité vocale, nous introduisons le concept de probabilité globale d'absence de parole (GSAP). Tout d’abord, nous calculons la probabilité d’absence de parole (SAP) conventionnelle, puis nous la modifions en fonction du GSAP nouvellement proposé. La modification est faite de telle sorte que le SAP ait la même valeur de GSAP en cas d'absence de parole alors qu'il est maintenu à sa valeur d'origine lorsque la parole est présente. De plus, pour améliorer les performances des SAP au niveau des queues vocales (périodes de transition de la parole au silence), nous révisons les SAP en utilisant un schéma de gueule de bois basé sur le modèle de Markov caché (HMM). De plus, nous proposons un algorithme robuste de mise à jour du bruit dans lequel la puissance du bruit est estimée non seulement pendant les périodes d'absence de parole mais également pendant l'activité vocale sur la base d'une décision douce. En outre, pour améliorer les routines de détermination SAP et de mise à jour du bruit, nous présentons un nouveau concept de rapport signal sur bruit (SNR), appelé SNR prédit dans cet article. De plus, nous démontrons que la transformée en cosinus discrète (DCT) améliore la précision de l'estimation SAP. Un certain nombre de tests montrent que la méthode proposée, appelée algorithme d'amélioration de la parole basée sur la décision douce (SESD), donne de meilleures performances que les approches conventionnelles.

Publication
IEICE TRANSACTIONS on Information Vol.E84-D No.9 pp.1231-1240
Date de publication
2001/09/01
Publicisé
ISSN en ligne
DOI
Type de manuscrit
PAPER
Catégories
Parole et audition

Auteurs

Mots-clés

Table des matières