La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Dependency Parsing with Lattice Structures for Resource-Poor Languages Analyse des dépendances avec des structures en treillis pour les langages pauvres en ressources

Sutee SUDPRASERT, Asanee KAWTRAKUL, Christian BOITET, Vincent BERMENT

  • Vues en texte intégral

    0

  • Citer

Résumé:

Dans cet article, nous présentons une nouvelle méthode d'analyse des dépendances pour les langues qui ont un très petit corpus annoté et pour lesquelles les méthodes de segmentation et d'analyse morphologique produisant un résultat unique (automatiquement désambiguïsé) sont très peu fiables. Notre méthode fonctionne sur un réseau morphosyntaxique factorisant tous les résultats possibles de segmentation et de marquage de parties du discours. La qualité de l’entrée dans l’analyse syntaxique est donc bien meilleure que celle d’une séquence unique et peu fiable de mots lemmatisés et étiquetés. Nous proposons une adaptation de l'algorithme d'Eisner pour trouver les k meilleurs arbres de dépendances dans une structure de réseau morphosyntaxique codant pour plusieurs résultats d'analyse morphosyntaxique. De plus, nous présentons comment utiliser la grammaire d'insertion de dépendances afin d'ajuster les scores et filtrer les arbres invalides, l'utilisation d'un modèle de langage pour rescorer les arbres d'analyse et le k-meilleure extension de notre modèle d'analyse. La précision d'analyse la plus élevée rapportée dans cet article est de 74.32 %, ce qui représente une amélioration de 6.31 % par rapport au modèle prenant en compte les données des outils d'analyse morphosyntaxique peu fiables.

Publication
IEICE TRANSACTIONS on Information Vol.E92-D No.10 pp.2122-2136
Date de publication
2009/10/01
Publicisé
ISSN en ligne
1745-1361
DOI
10.1587/transinf.E92.D.2122
Type de manuscrit
PAPER
Catégories
Traitement du langage naturel

Auteurs

Mots-clés

Table des matières