La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Acoustic Model Adaptation for Speech Recognition Adaptation du modèle acoustique pour la reconnaissance vocale

Koichi SHINODA

  • Vues en texte intégral

    0

  • Citer

Résumé:

La reconnaissance statistique de la parole utilisant des modèles de Markov cachés à densité continue (CDHMM) a donné naissance à de nombreuses applications pratiques. Cependant, en général, les discordances entre les données d’apprentissage et les données d’entrée dégradent considérablement la précision de la reconnaissance. Diverses techniques d'adaptation de modèles acoustiques utilisant quelques énoncés d'entrée ont été utilisées pour surmonter ce problème. Dans cet article, nous examinons ces techniques d'adaptation, notamment l'estimation du maximum a posteriori (MAP), la régression linéaire du maximum de vraisemblance (MLLR) et l'eigenvoice. Nous présentons également une vue schématique appelée pyramide d'adaptation pour illustrer les relations entre ces méthodes.

Publication
IEICE TRANSACTIONS on Information Vol.E93-D No.9 pp.2348-2362
Date de publication
2010/09/01
Publicisé
ISSN en ligne
1745-1361
DOI
10.1587/transinf.E93.D.2348
Type de manuscrit
Special Section INVITED PAPER (Special Section on Processing Natural Speech Variability for Improved Verbal Human-Computer Interaction)
Catégories

Auteurs

Mots-clés

Table des matières