La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Completion of Missing Labels for Multi-Label Annotation by a Unified Graph Laplacian Regularization Complétion des étiquettes manquantes pour l'annotation multi-étiquettes par une régularisation laplacienne à graphe unifié

Jonathan MOJOO, Yu ZHAO, Muthu Subash KAVITHA, Junichi MIYAO, Takio KURITA

  • Vues en texte intégral

    0

  • Citer

Résumé:

La tâche d'annotation d'images devient extrêmement importante pour une récupération efficace d'images à partir du Web et d'autres grandes bases de données. Cependant, l’énorme quantité d’informations sémantiques et la dépendance complexe des étiquettes sur une image rendent la tâche difficile. Par conséquent, déterminer la similarité sémantique entre plusieurs étiquettes sur une image est utile pour comprendre toute attribution d’étiquette incomplète pour la récupération d’image. Ce travail propose une nouvelle méthode pour résoudre le problème de l'annotation d'images multi-étiquettes en unifiant deux types différents de termes de régularisation laplaciens dans un réseau neuronal convolutif profond (CNN) pour des performances d'annotation robustes. Le modèle de régularisation laplacien unifié est implémenté pour traiter efficacement les étiquettes manquantes en générant la similarité contextuelle entre les étiquettes à la fois en interne et en externe grâce à leurs similitudes sémantiques, ce qui constitue la principale contribution de cette étude. Plus précisément, nous générons des matrices de similarité entre les étiquettes en interne en utilisant la méthode de quantification de type III de Hayashi et en externe en utilisant la méthode word2vec. Les matrices de similarité générées par les deux méthodes différentes sont ensuite combinées sous la forme d'un terme de régularisation laplacien, qui est utilisé comme nouvelle fonction objectif du CNN profond. Le terme de régularisation mis en œuvre dans cette étude est capable de résoudre le problème de l'annotation multi-étiquettes, permettant un réseau neuronal formé plus efficacement. Les résultats expérimentaux sur des ensembles de données de référence publics révèlent que le modèle de régularisation unifié proposé avec CNN profond produit des résultats nettement meilleurs que le CNN de base sans régularisation ni autres méthodes de pointe pour prédire les étiquettes manquantes.

Publication
IEICE TRANSACTIONS on Information Vol.E103-D No.10 pp.2154-2161
Date de publication
2020/10/01
Publicisé
2020/07/03
ISSN en ligne
1745-1361
DOI
10.1587/transinf.2019EDP7318
Type de manuscrit
PAPER
Catégories
Intelligence artificielle, exploration de données

Auteurs

Jonathan MOJOO
  Hiroshima University
Yu ZHAO
  Hiroshima University
Muthu Subash KAVITHA
  Hiroshima University
Junichi MIYAO
  Hiroshima University
Takio KURITA
  Hiroshima University

Mots-clés

Table des matières