Attribution d’un RNSR à une affiliation (Apprentissage)
Le RNSR, Référentiel National des Structures de Recherche (français), référence les structures de recherche publiques et privées au niveau national. Il est administré par le ministère chargé de la recherche.
En particulier, cet identifiant attribue à chaque structure de recherche un identifiant (par exemple 199213009E), et recense différents éléments décrivant la structure comme la date de création, l’éventuelle date de fermeture, l’adresse, le sigle, l’intitulé etc.
Ce web service permet, à partir d’une adresse d’affiliation d’auteur de trouver un identifiant. Il existe deux versions de ce web service :
- La V2, prenant en entrée une unique affiliation et retournant un unique RNSR (format chaîne de caractère).
- La V3, prenant en entrée une ou plusieurs affiliations (séparées impérativement par un « ; ») et retournant un tableau de un ou plusieurs RNSR.
Il utilise un modèle de classification type réseau de neurones, entraîné par apprentissage supervisé en utilisant la bibliothèque FastText.
Un autre web service similaire est disponible à ce lien, à la différence que l’entrée attendue pour ce dernier est une affiliation et une année et qu’il fonctionne par règles.
Sa précision est évaluée entre 0.95 et 0.98 et son silence entre 0.07 et 0.14.
Ce modèle a été entraîné et testé uniquement sur des affiliations : ces métriques ne sont pas garanties si l’entrée n’est pas vérifiée ou si la qualité des données est insuffisante.
Fasttext : https://fasttext.cc/docs/en/supervised-tutorial.html
Pour la V2
[
{
"id": 1,
"value": "UAR 76, Inist-CNRS, 2 rue Jean Zay 54500 Vandoeuvre-lès-Nancy"
},
{
"id": 2,
"value": "Institut Charles Gerhardt, Université de Montpellier"
},
{
"id": 3,
"value": "Affiliation trop imprécise ou non reconnue"
},
{
"id": 4,
"value": "UMR 7272 - CNRS, 06100 Nice"
}
]
Pour la V3
[
{
"id": 1,
"value": "UAR 76, Inist-CNRS, 2 rue Jean Zay 54500 Vandoeuvre-lès-Nancy"
},
{
"id": 2,
"value": "Institut Charles Gerhardt, Université de Montpellier"
},
{
"id": 3,
"value": "Affiliation trop imprécise ou non reconnue"
},
{
"id": 4,
"value": "Institut Charles Gerhardt, Université de Montpellier;UMR 7272 - CNRS, 06100 Nice"
}
]
Pour la V2
[
{
"id": 1,
"value": "198822446E"
},
{
"id": 2,
"value": "200711918D"
},
{
"id": 3,
"value": "n/a"
},
{
"id": 4,
"value": "201220250N"
}
]
Pour la V3
[
{
"id": 1,
"value": ["198822446E"]
},
{
"id": 2,
"value": ["200711918D"]
},
{
"id": 3,
"value": ["n/a"]
},
{
"id": 4,
"value": ["200711918D","201220250N"]
}
]