La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Lip Location Normalized Training for Visual Speech Recognition Formation normalisée sur la localisation des lèvres pour la reconnaissance visuelle de la parole

Oscar VANEGAS, Keiichi TOKUDA, Tadashi KITAMURA

  • Vues en texte intégral

    0

  • Citer

Résumé:

Cet article décrit une méthode pour normaliser la position des lèvres afin d'améliorer les performances d'un système de reconnaissance vocale basé sur des informations visuelles. Fondamentalement, il existe deux types d'informations utiles dans les processus de reconnaissance vocale ; le premier est le signal vocal lui-même et le second est l’information visuelle provenant des lèvres en mouvement. Cet article tente de résoudre certains problèmes causés par l'utilisation d'images de lèvres en mouvement, tels que l'effet produit par la variation de l'emplacement des lèvres. La méthode de normalisation de la localisation des lèvres proposée est basée sur un algorithme de recherche de la position des lèvres dans lequel la normalisation de la localisation est intégrée dans l'apprentissage du modèle. Des expériences de reconnaissance de mots isolés indépendantes du locuteur ont été réalisées sur les bases de données Tulips1 et M2VTS. Les expériences ont montré un taux de reconnaissance de 74.5 % et un taux de réduction des erreurs de 35.7 % pour la base de données M2VTS de reconnaissance de mots à dix chiffres.

Publication
IEICE TRANSACTIONS on Information Vol.E83-D No.11 pp.1969-1977
Date de publication
2000/11/25
Publicisé
ISSN en ligne
DOI
Type de manuscrit
PAPER
Catégories
Parole et audition

Auteurs

Mots-clés

Table des matières