rnsrLearnDetect - Attribution d’identifiant(s) RNSR à une adresse (Apprentissage)
Ce web service attribue un ou plusieurs identifiant(s) RNSR à partir d’une adresse d’affiliation d’auteur en langue française.
Le modèle utilisé est un réseau de neurones, entraîné par apprentissage supervisé en utilisant la bibliothèque fastText.
Les données d’entrainement sont issues de Hal ; elles peuvent être fournies sur demande.
N’hésitez pas à nous contacter.
Nous préconisons d’utiliser la V3 dont la sortie est homogène avec nos autres services. Les RNSR sont retournés dans le champ “rnsr” via un tableau. Le tableau est vide si aucun RNSR n’est trouvé.
La V2 retourne le RNSR directement au format chaîne de caractères. Quand aucun code RNSR n’est trouvé, le service renvoie “n/a”.
La précision du modèle est évaluée entre 0.89 et 0.94.
Le silence du modèle est évalué entre 0.07 et 0.14.
Le service est utilisé pour enrichir des documents de la base Conditor.
Précaution
Ce modèle a été entraîné et testé uniquement sur des affiliations : ces métriques ne sont pas garanties si l’entrée n’est pas vérifiée ou si la qualité des données est insuffisante.
Ce modèle a été testé sur le corpus d’évaluation “evaluation_corpus_RNSR”, disponible à l’adresse suivante :
https://www.ortolang.fr/market/corpora/evaluation-dataset-rnsr/v1
V2
La V2 prend en entrée une affiliation unique et retourne un code RNSR unique (format chaîne de caractères).
https://affiliation-rnsr.services.istex.fr/v2/affiliation/rnsr
V3
La V3 prend en entrée une ou plusieurs affiliation(s) (séparées impérativement par un “;”) et retourne un tableau de un ou plusieurs identifiants RNSR.
https://affiliation-rnsr.services.istex.fr/v3/affiliation/rnsr
Documentation de la bibliothèque python fastText : https://fasttext.cc/docs/en/supervised-tutorial.html
Pour la V2 une affiliation unique / un code RNSR unique
UAR 76, Inist-CNRS, 2 rue Jean Zay 54500 Vandoeuvre-lès-Nancy | ==> | 198822446E |
Institut Charles Gerhardt, Université de Montpellier | ==> | 200711918D |
Affiliation trop imprécise ou non reconnue | ==> | n/a |
UMR 7272 – CNRS, 06100 Nice | ==> | 201220250N |
Pour la V3 plusieurs affiliations séparées par un “;” et plusieurs codes RNSR
UAR 76, Inist-CNRS, 2 rue Jean Zay 54500 Vandoeuvre-lès-Nancy | ==> | 198822446E |
Institut Charles Gerhardt, Université de Montpellier | ==> | 200711918D |
Affiliation trop imprécise ou non reconnue | ==> | n/a |
Institut Charles Gerhardt, Université de Montpellier;UMR 7272 – CNRS, 06100 Nice | ==> | 200711918D, 201220250N |
Vous souhaitez connaître les entités de recherche à partir d’une adresse ou d’une affiliation ? Vous souhaitez les homogénéiser ? Vous souhaitez mettre en évidence les coopérations entre ces entités ?
En lançant rnsrLearnDetect sur vos données depuis Lodex, logiciel libre de visualisation, vous obtiendrez les codes RNSR et leur verbalisation ainsi que des représentations graphiques liées.
Graphes issus d’une étude réalisée pour la Direction des Données Ouvertes de la Recherche (DDOR) (Comptes rendus annuels d’activité des chercheurs CNRS 2020-2021).