Le site Objectif TDM est la vitrine des développements effectués à l’INIST autour du TDM (Text and Data Mining) et plus particulièrement la fouille de textes.

Le site a deux objectifs :

1. présenter les travaux effectués à l’Inist-CNRS sur le TDM:

  • des web-services, actualisés et mis en ligne au fur et à mesure de leur mise en production;
  • une application en ligne permettant de choisir des outils de TDM selon certains critères déterminés et déclinée

La genèse de ce projet a été explicitée dans les deux articles suivants:

2. donner accès à un blog sur le TDM

Il prend le relais de celui initié dans le cadre du projet VisaTM. Vous retrouverez donc bien évidemment tous les articles liés au projet VisaTM, mais plus largement, nous avons pour objectif d’exposer et échanger sur les travaux en cours autour de la thématique fouille de textes et/ou de données à l’Inist-CNRS ou chez nos partenaires. Nous partagerons également des éléments de veille sur le sujet ou des travaux qui auraient éveillé notre curiosité.

Historique

En 2017 l’INIST participe au projet VISA-TM, soutenu par le Comité pour la Science ouverte, dont l’objectif était de décrire une infrastructure capable de rendre la fouille de textes accessible à tous. Ce projet était un partenariat entre MaIAGE et DIST de l’INRA, l’Inist du CNRS et le LIRMM de l’Université de Montpellier.

Aujourd’hui, l’INIST s’engage dans le développement d’outils de TDM afin de traiter des textes issus principalement de publications scientifiques.

Ces outils destinés à des non spécialistes sont utilisables sans aucune installation et sans paramétrage via des web-services connectés directement au logiciel Lodex.

Lodex est un logiciel open source dédié à la valorisation de données structurées. Il facilite la curation et la sémantisation de données brutes pour les connecter au web de données via les normes et les standards du web sémantique. L’outil permet, de créer des sites web offrant des interfaces pour explorer les données au travers d’ une liste de fiches ou une série de graphiques dynamiques (histogrammes, cartes, diachronies, etc.).

Lodex propose une interface permettant de choisir facilement des traitements « TDM » ( via des web-services) que l’utilisateur peut appliquer sur ses propres jeux de données, et dont il peut visualiser le résultat dans des tableaux de bords dynamiques.

Ces web-services sont accessibles gratuitement par tout membre de l’ESR (Enseignement Supérieur et Recherche).

Si vous souhaitez vous y exprimer, n’hésitez pas à nous le faire savoir.