geoTag - Extraction d’entités géographiques

Malgré les contrôles qualité que nous effectuons avant de mettre nos web services en production, les outils d'IA peuvent commettre des erreurs. Nous vous recommandons de vérifier les informations importantes.

Niveau d'utilisation :  Débutant
Niveau de validation :  Validé
Objectif

Ce web service détecte des entités géographiques dans un texte en anglais et renvoie la liste des localisations trouvées dans ce texte.

Méthode

Pour l’extraction, le modèle utilisé par ce web service, “ner-english”, est disponible à ce lien huggingface.
Aucun fine-tuning n’a été opéré : nous mettons simplement le modèle à disposition via un web service.

Métriques

Le modèle a une f-mesure de 0.93 (CoNLL-03)

Précautions :

  • Le web service fonctionne uniquement sur du texte anglais.
  • Fonctionnant avec de l’apprentissage, il est nécessaire d’utiliser ce web service sur des phrases pour un résultat plus fiable.
Références
Absent de TDM Factory
Présent sur Lodex

Utilisation dans Lodex

Sélectionnez le web service dans le catalogue :

Enrichissement : le web service traite chaque document l’un après l’autre. Exemple pour l’extraction de termes à partir du résumé. On parlera de web service synchrone.

Saisir cette URL https://ner-tagger.services.istex.fr/v1/geoTagger/geoTagger et sélectionner la colonne dédiée au texte en anglais.
Sauvegarder et lancer le traitement

 

Traitement
The COVID-19 pandemic, also known as the coronavirus pandemic, is an ongoing global pandemic of coronavirus disease 2019 (COVID-19) caused by severe acute respiratory syndrome coronavirus2 (SARS-CoV-2). It was first identified in December 2019 in Wuhan, China. The World Health Organization declared the outbreak a Public Health Emergency of International Concern on 20 January 2020, and later a pandemic on 11 March 2020. ==> Wuhan,China

Vous souhaitez repérer dans votre corpus des termes géographiques ?
En lançant geoTag sur vos données depuis Lodex, logiciel libre de visualisation, vous obtiendrez la liste des termes géographiques et des représentations graphiques liées.


Graphes issus d’une étude réalisée pour le Laboratoire Chrono-Environnement (Production scientifique 2015-2022) et d’une étude réalisée pour le LSCE et l’IGE (Production scientifique 2000-2020). Le web service a traité le titre des publications.

En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres