La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Adaptive Lossy Data Compression Extended Architecture for Memory Bandwidth Conservation in SpMV Architecture étendue de compression adaptative des données avec perte pour la conservation de la bande passante mémoire dans SpMV

Siyi HU, Makiko ITO, Takahide YOSHIKAWA, Yuan HE, Hiroshi NAKAMURA, Masaaki KONDO

  • Vues en texte intégral

    0

  • Citer

Résumé:

Largement adoptée aujourd'hui par les applications d'apprentissage automatique et de traitement de graphiques, la multiplication matricielle-vecteur clairsemée (SpMV) est un algorithme très populaire en algèbre linéaire. C'est particulièrement le cas des couches MLP entièrement connectées, qui dominent de nombreux calculs SpMV et jouent un rôle important dans divers services. En conséquence, une grande partie des cycles des centres de données est consacrée aux noyaux SpMV. Pendant ce temps, malgré des options de stockage efficaces contre la rareté (telles que CSR ou CSC), les noyaux SpMV souffrent toujours du problème de bande passante mémoire limitée lors du transfert de données en raison de la hiérarchie de mémoire des systèmes informatiques modernes. De manière plus détaillée, nous constatons que les données entières et à virgule flottante utilisées dans les noyaux SpMV sont traitées clairement sans aucun prétraitement nécessaire. Par conséquent, nous pensons que les techniques de conservation de la bande passante, telles que la compression des données, peuvent considérablement aider les noyaux SpMV lorsque les données sont transférées entre la mémoire principale et le cache de dernier niveau (LLC). De plus, nous observons également que les conditions de convergence dans certains benchmarks de calcul scientifique typiques (basés sur les noyaux SpMV) ne seront pas dégradées lors de l'adoption de données à virgule flottante de moindre précision. Sur la base de ces résultats, nous proposons dans ce travail un schéma de compression de données simple mais efficace qui peut être étendu de préférence aux architectures informatiques à usage général ou aux systèmes HPC. Lorsqu'il est adopté, une accélération optimale de 1.92x est obtenue. En outre, les évaluations avec le noyau CG et l'algorithme PageRank indiquent que notre proposition introduit une surcharge négligeable à la fois sur la vitesse de convergence et sur la précision des résultats finaux.

Publication
IEICE TRANSACTIONS on Information Vol.E106-D No.12 pp.2015-2025
Date de publication
2023/12/01
Publicisé
2023/07/20
ISSN en ligne
1745-1361
DOI
10.1587/transinf.2023PAP0008
Type de manuscrit
Special Section PAPER (Special Section on Forefront Computing)
Catégories

Auteurs

Siyi HU
  University of Tokyo
Makiko ITO
  Fujitsu Ltd.
Takahide YOSHIKAWA
  Fujitsu Ltd.
Yuan HE
  Keio University
Hiroshi NAKAMURA
  University of Tokyo
Masaaki KONDO
  Keio University,RIKEN

Mots-clés

Table des matières