La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Sparse Time-Varying Complex AR (TV-CAR) Speech Analysis Based on Adaptive LASSO Analyse de la parole AR complexe à variation temporelle clairsemée (TV-CAR) basée sur le LASSO adaptatif

Keiichi FUNAKI

  • Vues en texte intégral

    0

  • Citer

Résumé:

L'analyse de prédiction linéaire (LP) est couramment utilisée dans le traitement de la parole. LP est basé sur le modèle auto-régressif (AR) et estime le paramètre du modèle AR à partir de signaux avec l2-optimisation des normes. Récemment, l’estimation clairsemée a retenu l’attention car elle peut extraire des caractéristiques significatives du Big Data. L’estimation parcimonie est réalisée par l1 or l0-optimisation ou régularisation des normes. Méthodes d'analyse Sparse LP basées sur l1-une optimisation des normes a été proposée. Puisque l’excitation de la parole n’est pas gaussienne blanche, une estimation LP clairsemée peut estimer un paramètre plus précis que l’estimation conventionnelle. l2-LP basé sur les normes. Il s’agit d’analyses invariantes dans le temps et à valeur réelle. Nous avons étudié l'analyse Time-Varying Complex AR (TV-CAR) pour un signal analytique et avons évalué les performances en matière de traitement de la parole. Les méthodes TV-CAR sont l2-méthodes normatives. Dans cet article, nous proposons l'analyse TV-CAR clairsemée basée sur le LASSO adaptatif (opérateur de retrait et de sélection le moins absolu) qui est l1-régularisation des normes et évaluation des performances sur F0 estimation de la parole par IRAPT (Instantaneous RAPT). Les résultats expérimentaux montrent que les méthodes TV-CAR clairsemées fonctionnent mieux pour un niveau élevé de bruit rose additif.

Publication
IEICE TRANSACTIONS on Fundamentals Vol.E102-A No.12 pp.1910-1914
Date de publication
2019/12/01
Publicisé
ISSN en ligne
1745-1337
DOI
10.1587/transfun.E102.A.1910
Type de manuscrit
Special Section LETTER (Special Section on Smart Multimedia & Communication Systems)
Catégories
Parole et audition

Auteurs

Keiichi FUNAKI
  University of the Ryukyus

Mots-clés

Table des matières