La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Recognition of Collocation Frames from Sentences Reconnaissance des cadres de collocation à partir de phrases

Xiaoxia LIU, Degen HUANG, Zhangzhi YIN, Fuji REN

  • Vues en texte intégral

    0

  • Citer

Résumé:

La collocation est un phénomène omniprésent dans les langues et une reconnaissance et une extraction précises de la collocation revêtent une grande importance pour de nombreuses tâches de traitement du langage naturel. Les collocations peuvent être différenciées des simples collocations bigrammes aux cadres de collocation (faisant référence aux collocations multi-grammes distantes). Jusqu’à présent, peu d’attention a été accordée aux cadres de colocalisation. Orientée vers la traduction et l'analyse syntaxique, cette étude vise à reconnaître et extraire les trames de collocation les plus longues possibles à partir de phrases données. Nous extrayons d’abord les collocations de bigrammes avec une méthode basée sur la sémantique distributionnelle en introduisant des modèles de collocation et en intégrant certaines mesures d’association de pointe. Sur la base des collocations de bigrammes extraites par la méthode proposée, nous obtenons les trames de collocation les plus longues en fonction de la nature récursive et des règles linguistiques des collocations. Par rapport aux systèmes de base, la méthode proposée fonctionne nettement mieux dans l’extraction de collocations de bigrammes, tant en termes de précision que de rappel. Et lors de l'extraction de trames de collocation, la méthode proposée fonctionne encore mieux avec une précision similaire à celle des résultats d'extraction de collocation de bigrammes.

Publication
IEICE TRANSACTIONS on Information Vol.E102-D No.3 pp.620-627
Date de publication
2019/03/01
Publicisé
2018/12/14
ISSN en ligne
1745-1361
DOI
10.1587/transinf.2018EDP7255
Type de manuscrit
PAPER
Catégories
Traitement du langage naturel

Auteurs

Xiaoxia LIU
  Dalian University of Technology
Degen HUANG
  Dalian University of Technology
Zhangzhi YIN
  Dalian University of Technology
Fuji REN
  Tokushima University

Mots-clés

Table des matières