La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Two-Path Object Knowledge Injection for Detecting Novel Objects With Single-Stage Dense Detector Injection de connaissances sur les objets à deux voies pour détecter de nouveaux objets avec un détecteur dense à un étage

KuanChao CHU, Hideki NAKAYAMA

  • Vues en texte intégral

    0

  • Citer

Résumé:

Nous présentons un système efficace pour intégrer des modules de classification générative à tir nul dans un détecteur dense de type YOLO afin de détecter de nouveaux objets. La plupart des nouvelles méthodes de détection d'objets à double étape sont obtenues en affinant la branche de sortie de classification mais ne peuvent pas être appliquées à un détecteur dense. Notre système utilise deux voies pour injecter des connaissances sur de nouveaux objets dans un détecteur dense. La première consiste à injecter la confiance de classe pour de nouvelles classes à partir d'un classificateur formé sur des données synthétisées via un générateur en deux étapes. Ce générateur apprend une fonction de mappage entre deux espaces de fonctionnalités, ce qui entraîne de meilleures performances de classification. La deuxième voie consiste à recycler la tête du détecteur avec des cartes de caractéristiques synthétisées à différents niveaux d'intensité. Cette approche augmente considérablement l’objectivité prédite pour les nouveaux objets, ce qui constitue un défi majeur pour un détecteur dense. Nous introduisons également un mécanisme d'arrêt et de rechargement pendant le recyclage pour l'optimisation entre les couches principales afin de mieux apprendre les fonctionnalités synthétisées. Notre méthode assouplit la contrainte sur l'architecture de la tête de détection dans la méthode précédente et a nettement amélioré les performances sur l'ensemble de données MSCOCO.

Publication
IEICE TRANSACTIONS on Information Vol.E106-D No.11 pp.1868-1880
Date de publication
2023/11/01
Publicisé
2023/08/02
ISSN en ligne
1745-1361
DOI
10.1587/transinf.2022EDP7216
Type de manuscrit
PAPER
Catégories
Reconnaissance d'images, vision par ordinateur

Auteurs

KuanChao CHU
  University of Tokyo
Hideki NAKAYAMA
  University of Tokyo

Mots-clés

Table des matières