La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Accelerating Smith-Waterman Algorithm for Biological Database Search on CUDA-Compatible GPUs Accélération de l'algorithme Smith-Waterman pour la recherche dans les bases de données biologiques sur les GPU compatibles CUDA

Yuma MUNEKAWA, Fumihiko INO, Kenichi HAGIHARA

  • Vues en texte intégral

    0

  • Citer

Résumé:

Cet article présente une méthode rapide capable d'accélérer l'algorithme de Smith-Waterman pour la recherche de bases de données biologiques sur un cluster d'unités de traitement graphique (GPU). Notre méthode est implémentée à l’aide de l’architecture de périphérique unifiée de calcul (CUDA), disponible sur le GPU nVIDIA. Par rapport aux méthodes précédentes, notre méthode apporte quatre contributions majeures. (1) Le procédé utilise efficacement la mémoire partagée sur puce pour réduire la quantité de données transférées entre la mémoire vidéo hors puce et les éléments de traitement du GPU. (2) Il réduit également le nombre de récupérations de données en appliquant une technique de réutilisation des données aux séquences de requêtes et de bases de données. (3) Une méthode pipeline est également implémentée pour chevaucher l'exécution du GPU avec l'accès à la base de données. (4) Enfin, un paradigme maître/travailleur est utilisé pour accélérer des centaines de recherches dans des bases de données sur un système en cluster. Lors d'expériences, les performances maximales sur une carte GeForce GTX 280 atteignent 8.32 mises à jour de cellules giga par seconde (GCUPS). Nous constatons également que notre méthode réduit la quantité de données récupérées à 1/140, atteignant des performances environ trois fois supérieures à celles d'une méthode précédente basée sur CUDA. Notre version de cluster à 32 nœuds est environ 28 fois plus rapide qu'une version à GPU unique. De plus, les performances effectives atteignent 75.6 giga instructions par seconde (GIPS) en utilisant 32 cartes GeForce 8800 GTX.

Publication
IEICE TRANSACTIONS on Information Vol.E93-D No.6 pp.1479-1488
Date de publication
2010/06/01
Publicisé
ISSN en ligne
1745-1361
DOI
10.1587/transinf.E93.D.1479
Type de manuscrit
Special Section PAPER (Special Section on Info-Plosion)
Catégories
Architecture parallèle et distribuée

Auteurs

Mots-clés

Table des matières