dataGraph - Graphe de mots clés
Ce web service génère un graphe de mots-clés à partir d’un corpus de résumés en anglais ou d’un ensemble de mots-clés déjà extraits.
L’algorithme fait appel au web service Teeft qui extrait les mots-clés d’un corpus de résumés en anglais. Les poids des nœuds et arêtes sont calculés en fonction de leur fréquence d’apparition. Un seuil d’affichage dynamique des nœuds et des arêtes est également présent. Ensuite, l’algorithme Louvain Communities est appliqué pour avoir un partitionnement du graphe (originellement en 3D). Une projection en 2D et un algorithme personnalisé sont ensuite appliqués pour rendre le graphe plus visuel.
Bien qu’il fonctionne sur des corpus de petite taille, il est préférable, pour avoir un meilleur rendu, de traiter un corpus volumineux ou une liste de mots-clés importante.
Textes
- A partir d’une liste de mots-clés :
https://data-graph.services.istex.fr/v1/graph - A partir de résumés anglais :
https://data-graph.services.istex.fr/v1/teeft-graph
Utilisation dans TDM Factory
Ce web service se lance sur un corpus Istex au format targz avec du texte en anglais ou des mots-clés.
2 images sont retournées au format suivant :
- gexf exploitable, entre autre, par Gephi
- png
Utilisation dans Lodex
Sélectionnez le web service dans le catalogue :
Précalcul : le web service traite le corpus dans sa globalité. Le résultat obtenu pour chaque document dépend des autres. Exemple pour la génération de clusters. On parlera de web service asynchrone
Pour une représentation graphique à partir de :
- mots-clés :
https://data-graph.services.istex.fr/v1/graph - résumés anglais :
https://data-graph.services.istex.fr/v1/teeft-graph
Voici les étapes après le lancement du précalcul :
- créer une ressource que vous n’êtes pas obligé de rendre visible.
- créer un graphique
- donner un nom
- sélectionner le précalcul
- choisir la routine raw-precomputed-modifier
- la colonne du label est id
- la colonne de la valeur est value
-
- choisir l’affichage graphe “Réseau positionné”
Voici un exemple de graphique


