La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

ASAN: Self-Attending and Semantic Activating Network towards Better Object Detection ASAN : réseau d'activation automatique et sémantique pour une meilleure détection d'objets

Xinyu ZHU, Jun ZHANG, Gengsheng CHEN

  • Vues en texte intégral

    0

  • Citer

Résumé:

Les détecteurs d'objets récents les plus performants dépendent généralement d'une approche en deux étapes, qui bénéficie de sa proposition de région et de sa pratique de raffinement, mais souffre d'une faible vitesse de détection. En revanche, les approches en une étape présentent l’avantage d’une grande efficacité tout en sacrifiant dans une certaine mesure leur précision. Dans cet article, nous proposons un nouveau réseau de détection d'objets à tir unique qui hérite des mérites des deux. Motivés par l'idée d'enrichissement sémantique des caractéristiques convolutionnelles au sein d'un détecteur profond typique, nous proposons deux nouveaux modules : 1) en modélisant les interactions sémantiques entre les canaux et les dépendances à longue portée entre les positions spatiales, le module autonome génère les deux canaux et positionner l'attention, et améliorer les caractéristiques convolutionnelles originales de manière autoguidée ; 2) en tirant parti de la capacité de localisation discriminante de classe du CNN formé à la classification, le module d'activation sémantique apprend une réponse convolutive sémantique significative qui augmente les caractéristiques convolutives de bas niveau avec de fortes informations sémantiques spécifiques à la classe. Le réseau dit d'activation automatique et sémantique (ASAN) atteint une meilleure précision que les méthodes en deux étapes et est capable d'effectuer un traitement en temps réel. Des expériences approfondies sur PASCAL VOC indiquent qu'ASAN atteint des performances de détection de pointe avec une efficacité élevée.

Publication
IEICE TRANSACTIONS on Information Vol.E103-D No.3 pp.648-659
Date de publication
2020/03/01
Publicisé
2019/11/25
ISSN en ligne
1745-1361
DOI
10.1587/transinf.2019EDP7164
Type de manuscrit
PAPER
Catégories
Reconnaissance d'images, vision par ordinateur

Auteurs

Xinyu ZHU
  Fudan University
Jun ZHANG
  Fudan University
Gengsheng CHEN
  Fudan University

Mots-clés

Table des matières