funderTag - Extraction de financeurs dans un article
Ce web service détecte des financeurs dans un article en anglais et renvoie la liste des financeurs repérés.
Ce web service fonctionne à partir d’un modèle de détection d’entités nommées entrainé de manière supervisée avec la bibliothèque python Flair sur un corpus annoté en interne. Les données d’entrainement et de test sont issues d’Istex. Il ne s’agit pas d’un corpus Gold.
En entrée, il prend un texte en anglais.
En sortie, il renvoie la liste des financeurs repérés ou une liste vide le cas échéant.
Le modèle possède une f-mesure de 0.83
Précautions
- Ce web service fonctionnant avec de l’apprentissage, il est nécessaire de l’utiliser sur des phrases pour un résultat plus fiable.
- Comme avec tout modèle d’apprentissage, les résultats sont liés au corpus sur lequel il a appris. Le service est donc améliorable avec de nouvelles données d’entrainement.
N’hésitez pas à nous contacter
Bibliothèque python Flair : https://huggingface.co/flair
Extraction d’entités géographiques
Extraction d’entités nommées de maladies
This study was funded by the CNRS and INIST. | ==> | CNRS, INIST |
Vous souhaitez connaître les agences qui ont financé les études présentent dans votre corpus ?
En lançant funderTag sur du texte intégral, depuis Lodex, logiciel libre de visualisation, vous obtiendrez la liste de ces agences et des représentations graphiques liées. Actuellement, les noms ne sont pas homogénéisés d’où la présence d’ANR et d’Agence Nationale de la Recherche
Graphe issu d’une étude réalisée pour la Direction des Données Ouvertes de la Recherche (DDOR) (Comptes rendus annuels d’activité des chercheurs CNRS 2020-2021). Le web service a traité le texte intégral.