La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

A Combined Alignment Model for Code Search Un modèle d'alignement combiné pour la recherche de code

Juntong HONG, Eunjong CHOI, Osamu MIZUNO

  • Vues en texte intégral

    1

  • Citer

Résumé:

La recherche de code est une tâche permettant de récupérer le code le plus pertinent compte tenu d'une requête en langage naturel. Plusieurs études récentes ont proposé des méthodes basées sur l'apprentissage en profondeur qui utilisent un modèle multi-encodeur pour analyser le code en plusieurs champs afin de représenter le code. Ces méthodes améliorent les performances du modèle en distinguant les codes similaires et en utilisant une matrice de relation pour relier le code et la requête. Cependant, ces modèles nécessitent plus de ressources de calcul et de paramètres que les modèles à codeur unique. De plus, l'utilisation de la matrice de relations qui repose uniquement sur le pooling maximum ne tient pas compte de la fourniture d'informations d'alignement des mots. Pour atténuer ces problèmes, nous proposons un modèle d'alignement combiné pour la recherche de code. Nous concaténons les champs multi-codes en une seule séquence pour représenter le code et utilisons un modèle de codage pour coder les fonctionnalités du code. De plus, nous transformons la matrice de relations en utilisant des vecteurs entraînables pour éviter les pertes d'informations. Ensuite, nous combinons une attention intra-modale et cross-modale pour attribuer les mots saillants tout en faisant correspondre le code et la requête correspondants. Enfin, nous appliquons le poids d’attention à l’intégration de code/requête et calculons la similarité cosinus. Pour évaluer les performances de notre modèle, nous comparons notre modèle avec six modèles précédents sur deux ensembles de données populaires. Les résultats montrent que notre modèle atteint des performances Top@0.614 de 0.687 et 1, surperformant les meilleurs modèles de comparaison de 12.2 % et 9.3 %, respectivement.

Publication
IEICE TRANSACTIONS on Information Vol.E107-D No.3 pp.257-267
Date de publication
2024/03/01
Publicisé
2023/12/15
ISSN en ligne
1745-1361
DOI
10.1587/transinf.2023MPP0002
Type de manuscrit
Special Section PAPER (Special Section on Empirical Software Engineering)
Catégories

Auteurs

Juntong HONG
  Kyoto Institute of Technology
Eunjong CHOI
  Kyoto Institute of Technology
Osamu MIZUNO
  Kyoto Institute of Technology

Mots-clés

Table des matières