La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Selective Learning of Human Pose Estimation Based on Multi-Scale Convergence Network Apprentissage sélectif de l'estimation de la pose humaine basé sur un réseau de convergence multi-échelles

Wenkai LIU, Cuizhu QIN, Menglong WU, Wenle BAI, Hongxia DONG

  • Vues en texte intégral

    4

  • Citer

Résumé:

L'estimation de pose est un point chaud de la recherche dans les tâches de vision par ordinateur et la clé de la perception informatique des activités humaines. Le concept central de l’estimation de la pose humaine consiste à décrire le mouvement du corps humain à travers les principaux points articulaires. De grands champs récepteurs et des informations spatiales riches facilitent la tâche de localisation des points clés, et la manière de capturer des entités à plus grande échelle et de les réintégrer dans l'espace des entités constitue un défi pour l'estimation de la pose. Pour résoudre ce problème, nous proposons un réseau de convergence multi-échelle (MSCNet) avec un large champ de réception et des informations spatiales riches. La structure du MSCNet est basée sur un réseau de sabliers qui capture des informations à différentes échelles pour présenter une compréhension cohérente du corps dans son ensemble. Les unités de champ récepteur multi-échelle (MSRF) fournissent un grand champ récepteur pour obtenir des informations contextuelles riches, qui sont ensuite sélectivement améliorées ou supprimées par le mécanisme d'attention Squeeze-Excitation (SE) pour effectuer de manière flexible la tâche d'estimation de pose. Les résultats expérimentaux montrent que MSCNet obtient un AP de 73.1 % sur l'ensemble de données COCO, soit une amélioration de 8.8 % par rapport à la méthode traditionnelle CMUPose. Comparé au CPN avancé, le MSCNet possède 68.2 % de complexité de calcul et seulement 55.4 % du nombre de paramètres.

Publication
IEICE TRANSACTIONS on Information Vol.E106-D No.5 pp.1081-1084
Date de publication
2023/05/01
Publicisé
2023/02/15
ISSN en ligne
1745-1361
DOI
10.1587/transinf.2022EDL8093
Type de manuscrit
LETTER
Catégories
Interaction homme machine

Auteurs

Wenkai LIU
  North China University of Technology
Cuizhu QIN
  North China University of Technology
Menglong WU
  North China University of Technology
Wenle BAI
  North China University of Technology
Hongxia DONG
  North China University of Technology

Mots-clés

Table des matières