rnsrLearnDetect - Attribution d’identifiant(s) RNSR à une adresse (Apprentissage)

Niveau d'utilisation :  Débutant
Niveau de validation :  Validé
Objectif

Ce web service attribue un ou plusieurs identifiant(s) RNSR à partir d’une adresse d’affiliation d’auteur en langue française.

Méthode

Le modèle utilisé est un réseau de neurones, entraîné par apprentissage supervisé en utilisant la bibliothèque fastText.
Les données d’entrainement sont issues de Hal ; elles peuvent être fournies sur demande.
N’hésitez pas à nous contacter.

Quand aucun code RNSR n’est trouvé, le service renvoie “n/a” (seul pour la v2 et dans un tableau pour la v3).

Métriques

La précision du modèle est évaluée entre 0.89 et 0.94.
Le rappel du modèle est évalué entre 0.07 et 0.14.

Le service est utilisé pour enrichir des documents de la base Conditor.

Précaution
Ce modèle a été entraîné et testé uniquement sur des affiliations : ces métriques ne sont pas garanties si l’entrée n’est pas vérifiée ou si la qualité des données est insuffisante.

 

Variantes

V2

La V2 prend en entrée une affiliation unique et retourne un code RNSR unique (format chaîne de caractères).
https://affiliation-rnsr.services.istex.fr/v2/affiliation/rnsr

V3

La V3 prend en entrée une ou plusieurs affiliation(s) (séparées impérativement par un “;”) et retourne un tableau de un ou plusieurs identifiants RNSR.
https://affiliation-rnsr.services.istex.fr/v3/affiliation/rnsr

Références

Documentation de la bibliothèque python fastText : https://fasttext.cc/docs/en/supervised-tutorial.html

Exemple textuel du traitement
Le format d'entrée :

Pour la V2 une affiliation unique / un code RNSR unique

UAR 76, Inist-CNRS, 2 rue Jean Zay 54500 Vandoeuvre-lès-Nancy ==> 198822446E
Institut Charles Gerhardt, Université de Montpellier ==> 200711918D
Affiliation trop imprécise ou non reconnue ==> n/a
UMR 7272 – CNRS, 06100 Nice ==> 201220250N

 

Pour la V3 plusieurs affiliations séparées par un “;” et plusieurs codes RNSR

UAR 76, Inist-CNRS, 2 rue Jean Zay 54500 Vandoeuvre-lès-Nancy ==> 198822446E
Institut Charles Gerhardt, Université de Montpellier ==> 200711918D
Affiliation trop imprécise ou non reconnue ==> n/a
Institut Charles Gerhardt, Université de Montpellier;UMR 7272 – CNRS, 06100 Nice ==> 200711918D, 201220250N
Le résultat :

Voici un graphique que l’on peut réaliser dans Lodex permettant de visualiser les co-publications.

En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres