Detect-country - Détection du pays d’une affiliation

Niveau d'utilisation :  Débutant
Niveau de validation :  Validé
Objectif

Ce web service détecte le pays d’origine d’une affiliation-adresse, qu’il soit présent ou absent dans celle-ci, quelle que soit la langue de l’adresse, à condition qu’elle soit dans un alphabet latin.

 

Méthode

A partir de l’adresse d’une affiliation, le service renvoie le nom du pays détecté, en anglais, ainsi que son code ISO sur 3 lettres.
Par exemple “France, FRA ” ou “Germany, DEU”.
Dans le cas où le programme ne parvient pas à déterminer le pays, il renvoie “Unknown, N/A”

La première étape consiste à extraire le pays s’il est présent dans l’adresse.

S’il est absent, le programme va s’appuyer sur des informations comme :

  • la rue,
  • la ville,
  • le code postal,
  • le nom de l’organisme.

Ces informations sont utilisées pour localiser l’adresse, à l’aide du service de géocodage Nominatim, et en déduire le pays.

Métriques

Le programme a été testé avec une  précision  de 97%.

Précautions :
La qualité du résultat dépend fortement des informations présentes dans l’affiliation : un nom de laboratoire seul donnera soit aucun résultat soit un résultat peu fiable.

 

Références

Ce service s’appuie sur le service de géocodage Nominatim fourni par le projet OpenStreetMap (OSM) (https://nominatim.org/release-docs/develop/api/Overview)

Exemple textuel du traitement
Le format d'entrée :

[
{
"id": 1,
"value": "université sciences et technologies bordeaux 1 institut national de physique nucléaire et de physique des particules du cnrs in2p3 UMR5797"
},
{
"id": 2,
"value": "uar76 / ups76 centre national de la recherche scientifique cnrs institut de l'information scientifique et technique inist"
},
{
"id": 3,
"value": "centre de recherches sur la géologie des matières premières minérales et énergétiques cregu université de lorraine ul umr7359 centre national de la recherche scient"
},
{

"id": 4,
"value": "auf der morgenstelle 8, 72076 tuebingen"
},
{
"id": 5,
"value": "z.i. de kermelin,16, rue ampère, 56017 Vannes"
},
{
"id": 6,
"value": "campus de santa apolónia, 5300-253 bragança"
},
{
"id": 7,
"value": "campus romanus de maron"
},
{
"id": 8,
"value": "Inist-CNRS, vandoeuvre les Nancy, France"
}
]
Le résultat :

[
{
"id": 1,
"value": ["France","FRA"]
},
{
"id": 2,
"value": ["France","FRA"]
},
{
"id": 3,
"value": ["France","FRA"]
},
{
"id": 4,
"value": ["Germany","DEU"]
},
{
"id": 5,
"value": ["France","FRA"]
},
{
"id": 6,
"value": ["Portugal","PRT"]
},
{
"id": 7,
"value": ["Unknown","N/A"]
},
{
"id": 8,
"value": ["France","FRA"]
}
]

Exemple de carte obtenue dans Lodex, à partir des noms de pays fournis par l’application sur un corpus de publications scientifiques

En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres