rnsrLearnDetect - Attribution d’identifiant(s) RNSR à une adresse (Apprentissage)
Ce web service attribue un ou plusieurs identifiant(s) RNSR à partir d’une adresse d’affiliation d’auteur en langue française.
Le modèle utilisé est un réseau de neurones, entraîné par apprentissage supervisé en utilisant la bibliothèque fastText.
Les données d’entrainement sont issues de Hal ; elles peuvent être fournies sur demande.
N’hésitez pas à nous contacter.
Les RNSR sont retournés dans le champ “rnsr” via un tableau. Le tableau est vide si aucun RNSR n’est trouvé.
La précision du modèle est évaluée entre 0.89 et 0.94.
Le silence du modèle est évalué entre 0.07 et 0.14.
Le service est utilisé pour enrichir des documents de la base Conditor.
Précaution
Ce modèle a été entraîné et testé uniquement sur des affiliations : ces métriques ne sont pas garanties si l’entrée n’est pas vérifiée ou si la qualité des données est insuffisante.
Ce modèle a été testé sur le corpus d’évaluation “evaluation_corpus_RNSR”, disponible à l’adresse suivante :
https://www.ortolang.fr/market/corpora/evaluation-dataset-rnsr/v1
Documentation de la bibliothèque python fastText : https://fasttext.cc/docs/en/supervised-tutorial.html
Utilisation dans Lodex
Sélectionnez le web service dans le catalogue :
Enrichissement : le web service traite chaque document l’un après l’autre. Exemple pour l’extraction de termes à partir du résumé. On parlera de web service synchrone.
Saisir cette URL https://affiliation-rnsr.services.istex.fr/v3/affiliation/rnsr et sélectionner la colonne dédiée à l’adresse française.
Sauvegarder et lancer le traitement
Pour récupérer la valeur souhaitée : GET et le nom du champ dont vous voulez extraire la donnée : rnsr
Pour la V3 plusieurs affiliations séparées par un “;” et plusieurs codes RNSR
| UAR 76, Inist-CNRS, 2 rue Jean Zay 54500 Vandoeuvre-lès-Nancy | ==> | 198822446E |
| Institut Charles Gerhardt, Université de Montpellier | ==> | 200711918D |
| Affiliation trop imprécise ou non reconnue | ==> | n/a |
| Institut Charles Gerhardt, Université de Montpellier;UMR 7272 – CNRS, 06100 Nice | ==> | 200711918D, 201220250N |
Vous souhaitez connaître les entités de recherche à partir d’une adresse ou d’une affiliation ? Vous souhaitez les homogénéiser ? Vous souhaitez mettre en évidence les coopérations entre ces entités ?
En lançant rnsrLearnDetect sur vos données depuis Lodex, logiciel libre de visualisation, vous obtiendrez les codes RNSR et leur verbalisation ainsi que des représentations graphiques liées.
Graphes issus d’une étude réalisée pour la Direction des Données Ouvertes de la Recherche (DDOR) (Comptes rendus annuels d’activité des chercheurs CNRS 2020-2021).

