La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Open Access
Simultaneous Estimation of Dish Locations and Calories with Multi-Task Learning
Open Access
Estimation simultanée de l'emplacement des plats et des calories avec apprentissage multitâche

Takumi EGE, Keiji YANAI

  • Vues en texte intégral

    81

  • Citer
  • Free PDF (2.6MB)

Résumé:

Ces dernières années, l’essor d’une alimentation saine a conduit à diverses applications de gestion alimentaire dotées d’une fonction de reconnaissance d’image pour enregistrer automatiquement les repas quotidiens. Cependant, la plupart des fonctions de reconnaissance d’images des applications existantes ne sont pas directement utiles pour les photos de plats composés de plusieurs plats et ne peuvent pas estimer automatiquement les calories des aliments. Pendant ce temps, les méthodologies de reconnaissance d’images ont considérablement progressé grâce à l’avènement du réseau neuronal convolutif (CNN). CNN a amélioré la précision de divers types de tâches de reconnaissance d'images telles que la classification et la détection d'objets. Par conséquent, nous proposons une estimation des calories alimentaires basée sur CNN pour les photos de plats contenant plusieurs plats. Notre méthode estime simultanément l'emplacement des plats et les calories des aliments par un apprentissage multitâche de la détection des plats de nourriture et de l'estimation des calories des aliments avec un seul CNN. Il est prévu d'atteindre une vitesse élevée et une petite taille de réseau grâce à une estimation simultanée dans un seul réseau. Étant donné qu'il n'existe actuellement aucun ensemble de données de photos d'aliments contenant plusieurs plats annotées à la fois avec des cadres de délimitation et des calories alimentaires, dans ce travail, nous utilisons alternativement deux types d'ensembles de données pour former un seul CNN. Pour les deux types d'ensembles de données, nous utilisons des photos d'aliments comportant plusieurs plats annotées avec des cadres de délimitation et des photos d'aliments contenant un seul plat avec les calories alimentaires. Nos résultats ont montré que notre méthode multitâche permettait d'obtenir une précision plus élevée, une vitesse plus élevée et une taille de réseau plus petite qu'un modèle séquentiel de détection d'aliments et d'estimation des calories alimentaires.

Publication
IEICE TRANSACTIONS on Information Vol.E102-D No.7 pp.1240-1246
Date de publication
2019/07/01
Publicisé
2019/04/25
ISSN en ligne
1745-1361
DOI
10.1587/transinf.2018CEP0004
Type de manuscrit
Special Section PAPER (Special Section on Multimedia for Cooking and Eating Activities)
Catégories

Auteurs

Takumi EGE
  The University of Electro-Communications
Keiji YANAI
  The University of Electro-Communications

Mots-clés

Table des matières