dataGraph - Graphe de mots clés

Malgré les contrôles qualité que nous effectuons avant de mettre nos web services en production, les outils d'IA peuvent commettre des erreurs. Nous vous recommandons de vérifier les informations importantes.

Niveau d'utilisation :  Débutant
Niveau de validation :  Expérimental
Objectif

Ce web service génère un graphe de mots-clés à partir d’un corpus de résumés en anglais ou d’un ensemble de mots-clés déjà extraits.

 

Méthode

L’algorithme fait appel au web service Teeft qui extrait les mots-clés d’un corpus de résumés en anglais. Les poids des nœuds et arêtes sont calculés en fonction de leur fréquence d’apparition. Un seuil d’affichage dynamique des nœuds et des arêtes est également présent. Ensuite, l’algorithme Louvain Communities est appliqué pour avoir un partitionnement du graphe (originellement en 3D). Une projection en 2D et un algorithme personnalisé sont ensuite appliqués pour rendre le graphe plus visuel.

Métriques

Bien qu’il fonctionne sur des corpus de petite taille, il est préférable, pour avoir un meilleur rendu, de traiter un corpus volumineux ou une liste de mots-clés importante.

Variantes

Textes

  • A partir d’une liste de mots-clés : https://data-graph.services.istex.fr/v1/graph
  • A partir de résumés anglaishttps://data-graph.services.istex.fr/v1/teeft-graph
Ces web services qui peuvent vous intéresser

Extraction de termes d'un texte via Teeft

Présent sur TDM Factory

Utilisation dans TDM Factory

Ce web service se lance sur un corpus Istex au format targz avec du texte en anglais ou des mots-clés.

2 images sont retournées au format suivant :

  • gexf exploitable, entre autre, par Gephi
  • png
Présent sur Lodex

Utilisation dans Lodex

Sélectionnez le web service dans le catalogue :

Précalcul : le web service traite le corpus dans sa globalité. Le résultat obtenu pour chaque document dépend des autres. Exemple pour la génération de clusters. On parlera de web service asynchrone

Pour une représentation graphique à partir de :

  • mots-clés : https://data-graph.services.istex.fr/v1/graph
  • résumés anglais :https://data-graph.services.istex.fr/v1/teeft-graph 

Voici les étapes après le lancement du précalcul :

  1. créer une ressource que vous n’êtes pas obligé de rendre visible.
  2. créer un graphique
    • donner un nom
    • sélectionner le précalcul
    • choisir la routine raw-precomputed-modifier
    • la colonne du label est id
    • la colonne de la valeur est value

    • choisir l’affichage graphe “Réseau positionné”

Voici un exemple de graphique

 

 

 

En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres