La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

The Effect of Corpus Size on Case Frame Acquisition for Predicate-Argument Structure Analysis L'effet de la taille du corpus sur l'acquisition de cas pour l'analyse de la structure prédicat-argument

Ryohei SASANO, Daisuke KAWAHARA, Sadao KUROHASHI

  • Vues en texte intégral

    0

  • Citer

Résumé:

Cet article rapporte l'effet de la taille du corpus sur l'acquisition d'un cadre de cas pour l'analyse de la structure prédicat-argument en japonais. Pour cette étude, nous collectons un corpus japonais comprenant jusqu'à 100 milliards de mots et construisons des cadres de cas à partir de corpus de six tailles différentes. Ensuite, nous appliquons ces cadres de cas à l'analyse syntaxique et de la structure de cas, ainsi qu'à la résolution d'anaphore zéro, afin d'étudier la relation entre la taille du corpus pour l'acquisition du cadre de cas et les performances de l'analyse de la structure prédicat-argument. Nous avons obtenu de meilleures analyses en utilisant des bases de cas construites à partir de corpus plus vastes ; la performance n’était pas saturée même avec un corpus de 100 milliards de mots.

Publication
IEICE TRANSACTIONS on Information Vol.E93-D No.6 pp.1361-1368
Date de publication
2010/06/01
Publicisé
ISSN en ligne
1745-1361
DOI
10.1587/transinf.E93.D.1361
Type de manuscrit
Special Section PAPER (Special Section on Info-Plosion)
Catégories
Traitement du langage naturel

Auteurs

Mots-clés

Table des matières