La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

GazeFollowTR: A Method of Gaze Following with Reborn Mechanism GazeFollowTR : une méthode de suivi du regard avec un mécanisme de renaissance

Jingzhao DAI, Ming LI, Xuejiao HU, Yang LI, Sidan DU

  • Vues en texte intégral

    13

  • Citer

Résumé:

Le suivi du regard consiste à estimer où un observateur regarde à l'intérieur d'une scène. Les informations sur l'observateur et sur la scène doivent être apprises pour déterminer les directions et les points de regard. Récemment, de nombreux travaux existants se sont concentrés uniquement sur des scènes ou des observateurs. En revanche, les cadres révélés pour le suivi du regard sont limités. Dans cet article, une méthode de suivi du regard utilisant un transformateur hybride est proposée. Sur la base de la méthode conventionnelle (GazeFollow), nous menons trois développements. Tout d’abord, un transformateur hybride est appliqué pour apprendre les images de la tête et les positions du regard. Deuxièmement, la fonction de perte du flipper est utilisée pour contrôler l’erreur du point de regard. Enfin, une nouvelle couche ReLU avec le mécanisme de renaissance (reborn ReLU) est réalisée pour remplacer les couches ReLU traditionnelles à différentes étapes du réseau. Pour tester les performances de nos développements, nous entraînons notre framework développé avec l'ensemble de données DL Gaze et évaluons le modèle sur notre ensemble collecté. Grâce à nos résultats expérimentaux, il peut être prouvé que notre cadre peut obtenir de meilleures performances que nos méthodes référencées.

Publication
IEICE TRANSACTIONS on Fundamentals Vol.E106-A No.6 pp.938-946
Date de publication
2023/06/01
Publicisé
2022/11/30
ISSN en ligne
1745-1337
DOI
10.1587/transfun.2022EAP1068
Type de manuscrit
PAPER
Catégories
Vision

Auteurs

Jingzhao DAI
  Nanjing University
Ming LI
  Nanjing University
Xuejiao HU
  Nanjing University
Yang LI
  Nanjing University
Sidan DU
  Nanjing University

Mots-clés

Table des matières