La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Querying Molecular Biology Databases by Integration Using Multiagents Interrogation de bases de données de biologie moléculaire par intégration à l'aide de multiagents

Hideo MATSUDA, Takashi IMAI, Michio NAKANISHI, Akihiro HASHIMOTO

  • Vues en texte intégral

    0

  • Citer

Résumé:

Dans cet article, nous proposons une méthode pour interroger des bases de données hétérogènes de biologie moléculaire. Étant donné que les données de biologie moléculaire sont distribuées dans plusieurs bases de données représentant différents domaines biologiques, il est hautement souhaitable d'intégrer les données ainsi que les corrélations entre les domaines. Cependant, étant donné que le nombre total de telles bases de données est très important et que les données contenues sont fréquemment mises à jour, il est difficile de maintenir l'intégration de l'intégralité du contenu des bases de données. Ainsi, nous proposons une méthode d'intégration dynamique basée sur la demande des utilisateurs, exprimée avec un langage de requête basé sur OQL. En limitant l'espace de recherche en fonction de la demande des utilisateurs, le coût de l'intégration peut être considérablement réduit. Les bases de données multiples présentent également une grande hétérogénéité, telle qu'une inadéquation sémantique entre les schémas de base de données. Par exemple, de nombreuses bases de données utilisent leur propre terminologie indépendante. Pour cette raison, il est généralement requis que la tâche d'intégration des données basée sur une demande de l'utilisateur soit effectuée de manière transitive ; recherchez d'abord dans chaque base de données les données qui satisfont la demande, puis récupérez à plusieurs reprises d'autres données qui correspondent aux données précédemment trouvées dans chaque base de données. Pour résoudre ce problème, nous introduisons deux types d'agents ; un agent de base de données et un agent utilisateur, qui résident respectivement dans chaque base de données et chez un utilisateur. La tâche d'intégration est effectuée par les agents ; les agents utilisateurs génèrent des demandes de récupération de données sur la base des résultats de recherche précédents effectués par les agents de base de données, et les agents de base de données recherchent dans leurs bases de données des données qui satisfont aux demandes reçues des agents utilisateurs. Nous avons développé un système prototype sur un réseau de postes de travail. Le système intègre quatre bases de données ; GenBank (une base de données de nucléotides d'ADN), SWISS-PROT, PIR (bases de données de séquences d'acides aminés protéiques) et PDB (une base de données de structures tridimensionnelles de protéines). Bien que les tailles de GenBank et de PDB dépassent chacune un milliard d'octets, le système a obtenu de bonnes performances dans la recherche de bases de données hétérogènes aussi volumineuses.

Publication
IEICE TRANSACTIONS on Information Vol.E82-D No.1 pp.199-207
Date de publication
1999/01/25
Publicisé
ISSN en ligne
DOI
Type de manuscrit
Special Section PAPER (Special Issue on New Generation Database Technologies)
Catégories
Bases de données distribuées et hétérogènes

Auteurs

Mots-clés

Table des matières