geoTag - Extraction d’entités géographiques
Ce web service détecte des entités géographiques dans un texte en anglais et renvoie la liste des localisations trouvées dans ce texte.
Pour l’extraction, le modèle utilisé par ce web service, “ner-english”, est disponible à ce lien huggingface.
Aucun fine-tuning n’a été opéré : nous mettons simplement le modèle à disposition via un web service.
Le modèle a une f-mesure de 0.93 (CoNLL-03)
Précautions :
- Le web service fonctionne uniquement sur du texte anglais.
- Fonctionnant avec de l’apprentissage, il est nécessaire d’utiliser ce web service sur des phrases pour un résultat plus fiable.
- Bibliothèque python Flair : https://github.com/flairNLP/flair
- Modèle ner-english : https://huggingface.co/flair/ner-english
Extraction d’entités nommées de maladies
Extraction d’entités nommées en astronomie
The COVID-19 pandemic, also known as the coronavirus pandemic, is an ongoing global pandemic of coronavirus disease 2019 (COVID-19) caused by severe acute respiratory syndrome coronavirus2 (SARS-CoV-2). It was first identified in December 2019 in Wuhan, China. The World Health Organization declared the outbreak a Public Health Emergency of International Concern on 20 January 2020, and later a pandemic on 11 March 2020. | ==> | Wuhan,China |
Vous souhaitez repérer dans votre corpus des termes géographiques ?
En lançant geoTag sur vos données depuis Lodex, logiciel libre de visualisation, vous obtiendrez la liste des termes géographiques et des représentations graphiques liées.
Graphes issus d’une étude réalisée pour le Laboratoire Chrono-Environnement (Production scientifique 2015-2022) et d’une étude réalisée pour le LSCE et l’IGE (Production scientifique 2000-2020). Le web service a traité le titre des publications.