La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Continuous Similarity Search for Dynamic Text Streams Recherche de similarité continue pour les flux de texte dynamiques

Yuma TSUCHIDA, Kohei KUBO, Hisashi KOGA

  • Vues en texte intégral

    0

  • Citer

Résumé:

La recherche de similarité pour les flux de données a attiré beaucoup d'attention en matière de recommandation d'informations. Dans ce contexte, des travaux récents de premier plan portent sur les dernières W éléments d'un flux de données en tant qu'ensemble évolutif et réduire la recherche de similarité pour les flux de données afin de définir la recherche de similarité. Alors qu’ils considèrent des ensembles standards composés d’éléments, cet article étudie uniquement la recherche de similarité pour les flux de texte et traite des ensembles évolutifs dont les éléments sont des textes. Plus précisément, nous formulons un nouveau problème de recherche à plage continue appelé problème CTS (Continuous similarity search for Text Sets). La tâche du problème CTS est de trouver tous les flux de texte de la base de données dont la similarité avec la requête devient supérieure à un seuil ε. Il résume un scénario dans lequel un système de recommandation basé sur les utilisateurs recherche des utilisateurs similaires sur les services de réseaux sociaux. Le CTS est important car il permet à la fois à la requête et à la base de données de changer dynamiquement. Nous développons un algorithme basé sur un élagage rapide pour le CTS. De plus, nous discutons de la manière de l’accélérer avec l’index inversé.

Publication
IEICE TRANSACTIONS on Information Vol.E106-D No.12 pp.2026-2035
Date de publication
2023/12/01
Publicisé
2023/09/21
ISSN en ligne
1745-1361
DOI
10.1587/transinf.2022EDP7229
Type de manuscrit
PAPER
Catégories
Ingénierie des données, systèmes d'information Web

Auteurs

Yuma TSUCHIDA
  University of Electro-Communications
Kohei KUBO
  University of Electro-Communications
Hisashi KOGA
  University of Electro-Communications

Mots-clés

Table des matières