La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

An LVCSR Based Reading Miscue Detection System Using Knowledge of Reference and Error Patterns Un système de détection des erreurs de lecture basé sur LVCSR utilisant la connaissance des modèles de référence et d'erreur

Changliang LIU, Fuping PAN, Fengpei GE, Bin DONG, Hongbin SUO, Yonghong YAN

  • Vues en texte intégral

    0

  • Citer

Résumé:

Cet article décrit un système de détection des erreurs de lecture basé sur le cadre conventionnel de reconnaissance vocale continue à grand vocabulaire (LVCSR) [1]. Afin d'incorporer les connaissances de référence (ce que le lecteur doit lire) et certains modèles d'erreurs dans le processus de décodage, deux méthodes sont proposées : l'incorporation dynamique de prononciation multiple (DMPI) et l'interpolation dynamique du modèle linguistique (DILM). DMPI ajoute dynamiquement quelques variations de prononciation dans l'espace de recherche pour prédire les substitutions et les insertions de lecture. Pour résoudre le conflit entre la couverture des prédications d’erreurs et la perplexité de l’espace de recherche, seules les variantes de prononciation liées à la référence sont ajoutées. DILM interpole dynamiquement le modèle de langage général sur la base de l'analyse de la référence et maintient ainsi les chemins actifs de décodage relativement proches de la référence. Cela rend la reconnaissance plus précise, ce qui améliore encore les performances de détection. Au stade final de la détection, un programme dynamique (DP) amélioré est utilisé pour aligner le réseau de confusion (CN) issu de la reconnaissance vocale et la référence afin de générer le résultat de détection. Les résultats expérimentaux montrent que les deux méthodes proposées peuvent diminuer le taux d'erreur égal (EER) de 14 % relativement, de 46.4 % à 39.8 %.

Publication
IEICE TRANSACTIONS on Information Vol.E92-D No.9 pp.1716-1724
Date de publication
2009/09/01
Publicisé
ISSN en ligne
1745-1361
DOI
10.1587/transinf.E92.D.1716
Type de manuscrit
PAPER
Catégories
Parole et audition

Auteurs

Mots-clés

Table des matières