geoTag - Extraction d’entités géographiques

Niveau d'utilisation :  Débutant
Niveau de validation :  Validé
Objectif

Ce web service détecte des entités géographiques dans un texte en anglais et renvoie la liste des localisations trouvées dans ce texte.

Méthode

Pour l’extraction, le modèle utilisé par ce web service, “ner-english”, est disponible à ce lien huggingface.
Aucun fine-tuning n’a été opéré : nous mettons simplement le modèle à disposition via un web service.

Métriques

Le modèle a une f-mesure de 0.93 (CoNLL-03)

Précautions :

  • Le web service fonctionne uniquement sur du texte anglais.
  • Fonctionnant avec de l’apprentissage, il est nécessaire d’utiliser ce web service sur des phrases pour un résultat plus fiable.
Références
Exemple textuel du traitement
Le format d'entrée :

[{"id":"2","value":"The COVID-19 pandemic, also known as the coronavirus pandemic, is an ongoing global pandemic of coronavirus disease 2019 (COVID-19) caused by severe acute respiratory syndrome coronavirus2 (SARS-CoV-2). It was first identified in December 2019 in Wuhan, China. The World Health Organization declared the outbreak a Public Health Emergency of International Concern on 20 January 2020, and later a pandemic on 11 March 2020. As of 2 April 2021, more than 129 million cases have been confirmed, with more than 2.82 million deaths attributed to COVID-19, making it one of the deadliest pandemics in history."}] 
Le résultat :

[{"id":"2","value":["Wuhan","China"]}] 

Vous souhaitez repérer dans votre corpus des termes géographiques ?
En lançant geoTag sur vos données depuis Lodex, logiciel libre de visualisation, vous obtiendrez la liste des termes géographiques et des représentations graphiques liées.


Graphes issus d’une étude réalisée pour le Laboratoire Chrono-Environnement (Production scientifique 2015-2022) et d’une étude réalisée pour le LSCE et l’IGE (Production scientifique 2000-2020). Le web service a traité le titre des publications.

En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres