La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Prediction of Driver's Visual Attention in Critical Moment Using Optical Flow Prédiction de l'attention visuelle du conducteur à un moment critique à l'aide du flux optique

Rebeka SULTANA, Gosuke OHASHI

  • Vues en texte intégral

    4

  • Citer

Résumé:

Ces dernières années, l'attention visuelle du conducteur a été activement étudiée pour la technologie d'automatisation de la conduite. Cependant, le nombre de modèles est faible pour percevoir une compréhension approfondie de l'attention du conducteur à différents moments. Tous les modèles d'attention traitent des représentations d'images à plusieurs niveaux par un réseau à deux flux/multi-flux, augmentant le coût de calcul en raison d'un incrément de paramètres du modèle. Cependant, la représentation d'images à plusieurs niveaux, telle que le flux optique, joue un rôle essentiel dans les tâches impliquant des vidéos. Par conséquent, afin de réduire le coût de calcul d'un réseau à deux flux et d'utiliser une représentation d'image à plusieurs niveaux, ce travail propose un modèle d'attention visuelle du conducteur à flux unique pour une situation critique. L’expérience a été menée à l’aide d’un ensemble de données de conduite critique accessible au public nommé BDD-A. Les résultats qualitatifs confirment l'efficacité du modèle proposé. De plus, les résultats quantitatifs soulignent que le modèle proposé surpasse les modèles d'attention visuelle de pointe selon CC et SIM. Des études d'ablation approfondies vérifient la présence du flux optique dans le modèle, la position du flux optique dans le réseau spatial, les couches de convolution pour traiter le flux optique et le coût de calcul par rapport à un modèle à deux flux.

Publication
IEICE TRANSACTIONS on Information Vol.E106-D No.5 pp.1018-1026
Date de publication
2023/05/01
Publicisé
2023/01/26
ISSN en ligne
1745-1361
DOI
10.1587/transinf.2022EDP7146
Type de manuscrit
PAPER
Catégories
Intelligence artificielle, exploration de données

Auteurs

Rebeka SULTANA
  Shizuoka University
Gosuke OHASHI
  Shizuoka University

Mots-clés

Table des matières