La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Real-Time and Energy-Efficient Face Detection on CPU-GPU Heterogeneous Embedded Platforms Détection de visages en temps réel et économe en énergie sur les plates-formes embarquées hétérogènes CPU-GPU

Chanyoung OH, Saehanseul YI, Youngmin YI

  • Vues en texte intégral

    0

  • Citer

Résumé:

Alors que l’efficacité énergétique est devenue une contrainte ou un objectif de conception majeur, les architectures multicœurs hétérogènes sont devenues des plates-formes cibles principales, non seulement dans les systèmes de serveurs mais également dans les systèmes embarqués. Les accélérateurs manycore tels que les GPU deviennent également populaires dans les domaines embarqués, ainsi que dans les cœurs de processeur hétérogènes. Cependant, comme le nombre de cœurs d'un GPU intégré est bien inférieur à celui d'un GPU de serveur, il est important d'utiliser à la fois des CPU multicœurs hétérogènes et des GPU pour atteindre le débit souhaité avec une consommation d'énergie minimale. Dans cet article, nous présentons une étude de cas de cartographie de la détection de visage basée sur LBP sur une plate-forme intégrée hétérogène CPU-GPU récente, qui exploite à la fois le parallélisme des tâches et le parallélisme des données pour atteindre une efficacité énergétique maximale avec une contrainte de temps réel. Nous présentons d'abord la technique de parallélisation de chaque tâche pour l'exécution du GPU, puis nous proposons des modèles de performances et d'énergie pour les exécutions parallèles de tâches et de données sur des processeurs hétérogènes, qui sont utilisés dans l'exploration de l'espace de conception pour le mappage optimal. L'espace de conception est énorme puisque non seulement l'hétérogénéité des processeurs tels que CPU-GPU et big.LITTLE, mais également divers taux de partitionnement des données pour l'exécution parallèle des données sur ces processeurs hétérogènes sont pris en compte. Dans notre étude de cas de détection de visage LBP sur Exynos 5422, l'erreur d'estimation des modèles de performance et d'énergie proposés était en moyenne de -2.19 % et -3.67 % respectivement. En trouvant systématiquement les cartographies optimales avec les modèles proposés, nous pourrions atteindre 28.6% de consommation d'énergie en moins par rapport à la cartographie manuelle, tout en respectant la contrainte temps réel.

Publication
IEICE TRANSACTIONS on Information Vol.E101-D No.12 pp.2878-2888
Date de publication
2018/12/01
Publicisé
2018/09/18
ISSN en ligne
1745-1361
DOI
10.1587/transinf.2018PAP0004
Type de manuscrit
Special Section PAPER (Special Section on Parallel and Distributed Computing and Networking)
Catégories
Systèmes en temps réel

Auteurs

Chanyoung OH
  University of Seoul
Saehanseul YI
  University of Seoul
Youngmin YI
  University of Seoul

Mots-clés

Table des matières