Antidot Information Factory et Antidot Finder Suite sont au cœur d’ISIDORE

Antidot >  Actualités >  Produit >  Antidot Information Factory et Antidot Finder Suite sont au cœur d’ISIDORE


Antidot Information Factory et Antidot Finder Suite sont au cœur d’ISIDORE, le plus grand projet web des données / open data français mené par le CNRS - TGE Adonis

4 avril 2011

Le CNRS - TGE Adonis vient d’ouvrir le portail ISIDORE, qui donne accès à plus d’un million de publications de la recherche scientifique française en sciences humaines et sociales. Ce nouvel outil destiné aux chercheurs et aux étudiants s’appuie sur le moteur de recherche Antidot Finder Suite pour l’accès aux informations, ainsi que sur Antidot Information Factory, une nouvelle solution qui facilite la captation, l’agrégation, la normalisation et l’enrichissement des données, accroissant la pertinence et la richesse de l’information restituée aux utilisateurs.


Le Très Grand Equipement Adonis du CNRS est destiné à offrir aux Sciences Humaines et Sociales (SHS) les moyens dont elles ont besoin pour assurer leur rayonnement : conservation pérenne des données, diffusion des savoirs, partage. Isidore en est le composant clé : il s’agit de la plateforme d’agrégation et d’enrichissement, le moteu r de recherche et de diffusion de toutes les données SHS. Isidore agrège plus de 850 sources de données différentes de formats variés : entrepôts de données semi structurées (thèses, fonds multimédia, livres), sites Web, blogs et carnets de recherche, flux RSS. Toutes ces données sont par nature structurellement et qualitativement très hétérogènes.

Isidore a été réalisé à partir des solutions Antidot Information Factory (AIF) et Antidot Finder Suite (AFS) d’Antidot. Antidot Information Factory permet de collecter les contenus de 850 sources représentant plus d’un million de publications, puis de nettoyer et normaliser toutes les données, de les enrichir (classification automatique, annotation à la volée), et de les aligner sur des référentiels partagés par la communauté scientifique. Plus de 30 traitements distincts sont réalisés par Antidot Information Factory sur chaque document collecté afin d’homogénéiser et valoriser l’information contenue. Les données enrichies sont rendues accessibles via AFS v7, le moteur de recherche sémantique d’Antidot, et sont exposées via un point accès SPARQL dans un souci d'ouverture des données publiques (Open Data), selon les règles du Web de données (Linked Data).

Pour Stéphane Pouyllau, co-directeur du projet au CNRS - TGE Adonis, « La mission principale du projet, réalisé par le très grand équipement Adonis du CNRS, était de proposer un accès unifié à des données hétérogènes et distribuées. Il s'agit de valoriser des données structurées et le texte intégral associé, produits dans les laboratoires et les bibliothèques de recherche. L'unification des données et l'enrichissement offre la possibilité de naviguer dans un espace documentaire et informationnel étendu permettant d'expl orer des questions scientifiques nouvelles mais aussi les frontières scientifiques des disciplines. Les trois modes d'accès (Web, API, triple store RDF) sont complémentaires et permettent de développer des outils à géométrie variable suivant les usages. Ainsi, la solution Information Factory d'Antidot, qui est au cœur d'ISIDORE, correspond pleinement aux attentes du TGE Adonis car elle permet de traiter à la fois les données structurées, le texte intégral, l'enrichissement, les modes d’accès dans le respect des standards du web sémantique ce qui est un réel plus pour nous. »



/ Ne pas manquer

Documentation Cas Client ISIDORE (PDF - 4 pages)

Dernière référence



Newsletter


Notre newsletter est trimestrielle, inscrivez-vous !

  • S'inscrire