La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Learning Speech Variability in Discriminative Acoustic Model Adaptation Apprentissage de la variabilité de la parole dans l'adaptation discriminante du modèle acoustique

Shoei SATO, Takahiro OKU, Shinichi HOMMA, Akio KOBAYASHI, Toru IMAI

  • Vues en texte intégral

    0

  • Citer

Résumé:

Nous présentons une nouvelle méthode discriminante d'adaptation de modèles acoustiques qui traite d'une variabilité de la parole dépendante de la tâche. Nous nous sommes concentrés sur les différences d'expressions ou de styles de parole entre les tâches et avons fixé l'objectif de cette méthode comme améliorant la précision de la reconnaissance de phrases indistinctement prononcées en fonction d'un style de parole. L'adaptation ajoute des modèles de sous-mots pour les variantes de sous-mots fréquemment observables dans la tâche. Pour trouver les variantes dépendant de la tâche, les mots à faible confiance sont sélectionnés statistiquement parmi les mots ayant une fréquence plus élevée dans les données d'adaptation de la tâche en utilisant leurs réseaux de mots. Les paramètres HMM de modèles de sous-mots dépendant des mots sont entraînés de manière discriminante à l'aide de transformations linéaires avec un critère d'erreur phonétique minimale (MPE). Pour la formation MPE, la précision des sous-mots discriminant les variantes et les originaux est également étudiée. Dans les expériences de reconnaissance vocale, l'adaptation proposée avec les variantes de sous-mots a réduit le taux d'erreur de mot de 12.0 % par rapport dans une tâche de diffusion conversationnelle japonaise.

Publication
IEICE TRANSACTIONS on Information Vol.E93-D No.9 pp.2370-2378
Date de publication
2010/09/01
Publicisé
ISSN en ligne
1745-1361
DOI
10.1587/transinf.E93.D.2370
Type de manuscrit
Special Section PAPER (Special Section on Processing Natural Speech Variability for Improved Verbal Human-Computer Interaction)
Catégories
Adaptation

Auteurs

Mots-clés

Table des matières