rnsrLearnDetect - Attribution d’identifiant(s) RNSR à une adresse (Apprentissage)

Niveau d'utilisation :  Débutant
Niveau de validation :  Validé
Objectif

Ce web service attribue un ou plusieurs identifiant(s) RNSR à partir d’une adresse d’affiliation d’auteur en langue française.

Méthode

Le modèle utilisé est un réseau de neurones, entraîné par apprentissage supervisé en utilisant la bibliothèque fastText.
Les données d’entrainement sont issues de Hal ; elles peuvent être fournies sur demande.
N’hésitez pas à nous contacter.

Nous préconisons d’utiliser la V3 dont la sortie est homogène avec nos autres services. Les RNSR sont retournés dans le champ “rnsr” via un tableau. Le tableau est vide si aucun RNSR n’est trouvé.

La V2 retourne le RNSR directement au format chaîne de caractères. Quand aucun code RNSR n’est trouvé, le service renvoie “n/a”.

Métriques

La précision du modèle est évaluée entre 0.89 et 0.94.
Le silence du modèle est évalué entre 0.07 et 0.14.

Le service est utilisé pour enrichir des documents de la base Conditor.

Précaution
Ce modèle a été entraîné et testé uniquement sur des affiliations : ces métriques ne sont pas garanties si l’entrée n’est pas vérifiée ou si la qualité des données est insuffisante.

 

Variantes

V2

La V2 prend en entrée une affiliation unique et retourne un code RNSR unique (format chaîne de caractères).
https://affiliation-rnsr.services.istex.fr/v2/affiliation/rnsr

V3

La V3 prend en entrée une ou plusieurs affiliation(s) (séparées impérativement par un “;”) et retourne un tableau de un ou plusieurs identifiants RNSR.
https://affiliation-rnsr.services.istex.fr/v3/affiliation/rnsr

Références

Documentation de la bibliothèque python fastText : https://fasttext.cc/docs/en/supervised-tutorial.html

Traitement

Pour la V2 une affiliation unique / un code RNSR unique

UAR 76, Inist-CNRS, 2 rue Jean Zay 54500 Vandoeuvre-lès-Nancy ==> 198822446E
Institut Charles Gerhardt, Université de Montpellier ==> 200711918D
Affiliation trop imprécise ou non reconnue ==> n/a
UMR 7272 – CNRS, 06100 Nice ==> 201220250N

 

Pour la V3 plusieurs affiliations séparées par un “;” et plusieurs codes RNSR

UAR 76, Inist-CNRS, 2 rue Jean Zay 54500 Vandoeuvre-lès-Nancy ==> 198822446E
Institut Charles Gerhardt, Université de Montpellier ==> 200711918D
Affiliation trop imprécise ou non reconnue ==> n/a
Institut Charles Gerhardt, Université de Montpellier;UMR 7272 – CNRS, 06100 Nice ==> 200711918D, 201220250N

Vous souhaitez connaître les entités de recherche à partir d’une adresse ou d’une affiliation ? Vous souhaitez les homogénéiser ? Vous souhaitez mettre en évidence les coopérations entre ces entités ?
En lançant rnsrLearnDetect sur vos données depuis Lodex, logiciel libre de visualisation, vous obtiendrez les codes RNSR et leur verbalisation ainsi que des représentations graphiques liées.

Graphes issus d’une étude réalisée pour la Direction des Données Ouvertes de la Recherche (DDOR) (Comptes rendus annuels d’activité des chercheurs CNRS 2020-2021).

En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres