La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Esophageal Speech Enhancement Based on Statistical Voice Conversion with Gaussian Mixture Models Amélioration de la parole œsophagienne basée sur la conversion statistique de la voix avec des modèles de mélange gaussien

Hironori DOI, Keigo NAKAMURA, Tomoki TODA, Hiroshi SARUWATARI, Kiyohiro SHIKANO

  • Vues en texte intégral

    0

  • Citer

Résumé:

Cet article présente une nouvelle méthode d’amélioration de la parole œsophagienne à l’aide d’une conversion statistique de la voix. La parole œsophagienne est l’une des méthodes alternatives de parole pour les laryngectomisés. Bien que cela ne nécessite aucun appareil externe, les voix générées ne semblent généralement pas naturelles par rapport à la parole normale. Pour améliorer l'intelligibilité et le naturel de la parole œsophagienne, nous proposons une méthode de conversion vocale de la parole œsophagienne en parole normale. Un paramètre spectral et des paramètres d'excitation de la parole normale cible sont estimés séparément à partir d'un paramètre spectral de la parole œsophagienne sur la base de modèles de mélange gaussien. Les résultats expérimentaux démontrent que la méthode proposée apporte des améliorations significatives en termes d'intelligibilité et de naturel. Nous appliquons également une conversion d'eigenvoice un-à-plusieurs à l'amélioration de la parole œsophagienne pour permettre de contrôler de manière flexible la qualité vocale d'une parole améliorée.

Publication
IEICE TRANSACTIONS on Information Vol.E93-D No.9 pp.2472-2482
Date de publication
2010/09/01
Publicisé
ISSN en ligne
1745-1361
DOI
10.1587/transinf.E93.D.2472
Type de manuscrit
Special Section PAPER (Special Section on Processing Natural Speech Variability for Improved Verbal Human-Computer Interaction)
Catégories
Conversion vocale

Auteurs

Mots-clés

Table des matières