La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Vector Quantization of Speech Spectrum Based on the VQ-VAE Embedding Space Learning by GAN Technique Quantification vectorielle du spectre vocal basée sur l'apprentissage spatial d'intégration VQ-VAE par la technique GAN

Tanasan SRIKOTR, Kazunori MANO

  • Vues en texte intégral

    0

  • Citer

Résumé:

Le paramètre d'enveloppe spectrale est un paramètre de parole important dans la qualité du vocodeur. Récemment, le Vector Quantized Variational AutoEncoder (VQ-VAE) est une méthode de quantification de bout en bout de pointe basée sur le modèle d'apprentissage en profondeur. Cet article propose une nouvelle technique pour améliorer l'apprentissage spatial d'intégration de VQ-VAE avec le Generative Adversarial Network pour quantifier le paramètre d'enveloppe spectrale, appelée VQ-VAE-EMGAN. Lors d'expériences, nous avons conçu le quantificateur pour les paramètres d'enveloppe spectrale du vocodeur WORLD extraits de la forme d'onde vocale à 16 kHz. Comme le montrent les résultats, la technique proposée a réduit la distorsion spectrale log (LSD) d'environ 0.5 dB et a augmenté le PESQ d'environ 0.17 en moyenne pour quatre opérations sur bits cibles par rapport au VQ-VAE conventionnel.

Publication
IEICE TRANSACTIONS on Fundamentals Vol.E105-A No.4 pp.647-654
Date de publication
2022/04/01
Publicisé
2021/09/30
ISSN en ligne
1745-1337
DOI
10.1587/transfun.2021SMP0018
Type de manuscrit
Special Section PAPER (Special Section on Smart Multimedia & Communication Systems)
Catégories
Parole et audition, traitement du signal numérique

Auteurs

Tanasan SRIKOTR
  Shibaura Institute of Technology
Kazunori MANO
  Shibaura Institute of Technology

Mots-clés

Table des matières