sciencemetrixClass - Classification en domaines scientifiques Science-Metrix

Malgré les contrôles qualité que nous effectuons avant de mettre nos web services en production, les outils d'IA peuvent commettre des erreurs. Nous vous recommandons de vérifier les informations importantes.

Niveau d'utilisation :  Débutant
Niveau de validation :  Expérimental
Objectif

Ce web service classe des documents en anglais dans les trois niveaux de la classification Science-Metrix.

Méthode

Les trois niveaux de la classification sont renvoyés dans un tableau dans un champ “classif” et le i-ème élément du tableau correspond au i-ème niveau.

Le modèle utilisé est un réseau de neurones, entraîné par apprentissage supervisé en utilisant la bibliothèque fastText. Les labels dont nous disposions étaient des domaines scientifiques Science-Metrix de revue et non de documents : nous avons appliqué l’algorithme des KPPV en utilisant la bibliothèque Faiss pour sélectionner les données les plus pertinentes de notre corpus pour l’entraînement et l’évaluation de notre modèle.

Pour plus d’informations concernant l’entraînement de ce modèle, nous vous invitons à regarder sur notre github dédié.

Métriques

Ce modèle a une accuracy de 0.85 et un silence de 0.03 pour des résumés d’articles scientifiques en anglais composés d’au moins 100 caractères.

Références

Classification Science-Metrix : https://science-metrix.com/classification/ .

Absent de TDM Factory
Présent sur Lodex

Utilisation dans Lodex

Sélectionnez le web service dans le catalogue :

Enrichissement : le web service traite chaque document l’un après l’autre. Exemple pour l’extraction de termes à partir du résumé. On parlera de web service synchrone.

Saisir cette URL https://sciencemetrix-classification.services.istex.fr/v1/classif et sélectionner la colonne dédiée au texte en anglais.
Sauvegarder et lancer le traitement
Pour récupérer la valeur souhaitée : GET et le nom du champ dont vous voulez extraire la donnée : classif

 

Traitement
Anatomical comparison between compression wood and opposite wood in a branch of korean pine pinus koraiensis compression wood and opposite wood formed in the branch of korean pine pinus koraiensis s et z is described and compared in qualitative and quantitative anatomical aspects … ==> [“Applied Sciences”, “Agriculture,Fisheries & Forestry”, “Forestry”]
Pour aller plus loin

Voici l’enrichissement avancé à utiliser dans Lodex sur la sortie du web service pour pouvoir pré-traiter les données dans l’optique de faire un graphique hiérarchique :


[assign]
path=value
value = get("value.Classification Science-Metrix.classif").map((item,rang) => item === "" ? "" : `${rang+1}-${item}`).filter()

où “Classification Science-Metrix” est le nom de la colonnne à traiter.

Vous avez un corpus et vous souhaitez en connaître le contenu ?
En lançant sciencemetrixClass sur vos données depuis Lodex, logiciel libre de visualisation, vous obtiendrez pour chaque document l’intitulé de la classe à laquelle il appartient et des représentations graphiques liées.

En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres