LoterreEnrich - Enrichissement à l’aide des vocabulaires Loterre

Malgré les contrôles qualité que nous effectuons avant de mettre nos web services en production, les outils d'IA peuvent commettre des erreurs. Nous vous recommandons de vérifier les informations importantes.

Niveau d'utilisation :  Débutant
Niveau de validation :  Expérimental
Objectif

Ces web services (un par vocabulaire) permettent :

  • à partir d’une liste de termes, la récupération des identifiants et des termes préférentiels anglais et français (voire davantage) d’un vocabulaire Loterre grâce à la mise en correspondance entre la liste de termes et le vocabulaire Loterre sélectionné
  • à partir d’une liste de termes, la récupération de toutes les informations relatives à des termes grâce à la mise en correspondance entre la liste de termes et le vocabulaire Loterre sélectionné (au format SKOS)
  • à partir d’un texte (résumé), l’annotation d’un texte : il extrait des termes issus d’un texte et récupère certaines informations (ex. la langue et le préférentiel) grâce à la mise en correspondance entre les termes extraits et le vocabulaire Loterre sélectionné
Méthode

La plateforme Loterre propose des vocabulaires ou terminologies dans différents domaines scientifiques. Un concept scientifique est représenté par un ou plusieurs termes qui peuvent enrichir les extractions.

50 vocabulaires sont interrogeables (liste par ordre alphabétique du nom du vocabulaire) :

27X   Art et Archéologie
MDL   Astronomie
BLH   Biodiversité
BRMH   Biotechnologies de la reproduction
ERC   Classification de l’ERC
D63   Communes (France)
RVQ   Composés inorganiques
C0X   Covid-19
CUEX   Cuisson-extrusion
DOM   Domaines scientifiques
EMTD   Écologie microbienne du tube digestif
3WV   Écotoxicologie
216   Éducation
RDR   Électronique
KW5   Ethnologie
GGMGG   Génétique moléculaire
GT    Géographie
KG7   Géographie de l’Amérique du Nord
XD4   Histoire des sciences et techniques
4V5   Histoire et sciences des religions
IDIA   Ionisation dans l’industrie agro-alimentaire
2XK   Laboratoires
P21   Littérature
PSR   Mathématiques
P66   Mémoire
JVR   MESH
BVM   NETSCITY
th63   Nomenclature zoologique
FMC   Optique
QX8   Paléoclimatologie
PAN   Panification au levain naturel
VH8   Pathologies humaines
9SD   Pays et subdivisions
73G   Philosophie
NHT   Physique de l’état condensé
VPAC   Politique Agricole Commune
905   Préhistoire
N9J   SAGE
TSP   Santé publique
TSO   Science ouverte
26L   Sciences de la terre
3JP   Sociologie
8HQ   Tableau périodique des éléments
G9G   Taxonomie des poissons
TSM   Techniques de séparation par membranes
LTK   ThesoTM
8LP   Traitement automatique des langues
SN8   Traitement du signal
1WB   Transferts de chaleur
W7B   Transfusion sanguine
Variantes

Pour spécifier le vocabulaire à utiliser, il faut remplacer dans les URL ci-dessous loterreID par l’identifiant du vocabulaire (ex: 1WB).

Extraction d’informations à partir d’une liste de termes (identify)

https://loterre-resolvers.services.istex.fr/v1/identify?loterreID=loterreID

https://loterre-resolvers.services.istex.fr/v1/identify?loterreID=1WB

Extraction des informations au format SKOS à partir d’une liste de termes (expand)

https://loterre-resolvers.services.istex.fr/v1/expand?loterreID=loterreID

https://loterre-resolvers.services.istex.fr/v1/expand?loterreID=1WB

Annotation d’un texte (résumé) et récupération d’informations des termes extraits – annotate

https://loterre-resolvers.services.istex.fr/v1/annotate?loterreID=loterreID

https://loterre-resolvers.services.istex.fr/v1/annotate?loterreID=1WB

Langues : par défaut le web service traite de l’anglais. Vous pouvez spécifiez la langue en paramétrant l’URL

https://loterre-resolvers.services.istex.fr/v1/annotate?loterreID=loterreID&lang=en

https://loterre-resolvers.services.istex.fr/v1/annotate?loterreID=loterreID&lang=fr

 

Références

Le site des terminologies en partage : Loterre.

Absent de TDM Factory
Présent sur Lodex

Utilisation dans Lodex

Sélectionnez le web service dans le catalogue :

Enrichissement : le web service traite chaque document l’un après l’autre. Exemple pour l’extraction de termes à partir du résumé. On parlera de web service synchrone.

URL à renseigner si vous ne trouvez pas les types d’enrichissement LoterreEnrich dans le catalogue Lodex ou si vous voulez lancer le web service en ligne de commande.

3 traitements sont proposés pour un vocabulaire Loterre. L’identifiant de chaque vocabulaire se trouve dans la partie “Description” de cette fiche.

  • A partir d’une liste de termes, récupération au minimum des identifiants, des préférentiels français et anglais du vocabulaire sélectionné. L’URL est de la forme :
    https://loterre-resolvers.services.istex.fr/v1/identify?loterreID=loterreID Où le deuxième loterreID est l’identifiant du vocabulaire retenu.
    Si vous souhaitez interroger le vocabulaire consacré à la biodiversité, renseignez cette URL :
    https://loterre-resolvers.services.istex.fr/v1/identify?loterreID=BLH
  • A partir d’une liste de termes, récupération de tous les éléments d’un terme présent dans le vocabulaire sélectionné au format SKOS. L’URL est de la forme :
    https://loterre-resolvers.services.istex.fr/v1/expand?loterreID=loterreID Où le deuxième loterreID est l’identifiant du vocabulaire retenu.
    Si vous souhaitez interroger le vocabulaire consacré à la biodiversité, renseignez cette URL :
    https://loterre-resolvers.services.istex.fr/v1/expand?loterreID=BLH
  • A partir d’un texte (exemple, un résumé), extraction de termes et récupération des informations associées aux termes présents dans le vocabulaire sélectionné. L’URL est de la forme :
    https://loterre-resolvers.services.istex.fr/v1/annotate?loterreID=loterreID Où le deuxième loterreID est l’identifiant du vocabulaire retenu.
    Si vous souhaitez interroger le vocabulaire consacré à la biodiversité, renseignez cette URL
    https://loterre-resolvers.services.istex.fr/v1/annotate?loterreID=BLH
Traitement

Voici ce qui est retourné dans le cadre du traitement Identify avec le vocabulaire Pays et subdivisions (identifiant 9SD)

Données Résultats
CAN ==> “about”: “http://data.loterre.fr/ark:/67375/9SD-QDWJ08N6-7”,
“prefLabel@fr”: “Canada”,
“prefLabel@en”: “Canada”,
“latitude”: “57.7487688035733”,
“longitude”: “-101.569822125212”
“cartographyCode”:”CAN”
Japan ==> “about”: “http://data.loterre.fr/ark:/67375/9SD-T7D7448F-7”,
“prefLabel@fr”: “Japon”,
“prefLabel@en”: “Japan”,
“latitude”: “36.019075365944”,
“longitude”: “136.881947315984”
“cartographyCode”:”JPN”

Voici ce qui est retourné dans le cadre du traitement expand avec le vocabulaire Pays et subdivisions (identifiant 9SD)

Données Résultats
CAN ==> “about”: “http://data.loterre.fr/ark:/67375/9SD-QDWJ08N6-7”,
“prefLabel@fr”: “Canada”,
“prefLabel@en”: “Canada”,
“latitude”: “57.7487688035733”,
“longitude”: “-101.569822125212”
“cartographyCode”:”CAN”
“geonamesID”:”6251999″
“featureClass”:”https://www.geonames.org/ontology#A”
“feature_Code”:”https://www.geonames.org/ontology#A.PCLI”

“broader.prefLabelFR”:”Amérique septentrional”
“broader.prefLabelEN”:”Northern America”
“narrower.prefLabelFR”:”Ottawa”
“narrower.prefLabelEN”:”Ottawa”
Japan ==> “about”: “http://data.loterre.fr/ark:/67375/9SD-T7D7448F-7”,
“prefLabel@fr”: “Japon”,
“prefLabel@en”: “Japan”,
“latitude”: “36.019075365944”,
“longitude”: “136.881947315984”
“cartographyCode”:”JPN”
“geonamesID”:”1861060″
“featureClass”:”https://www.geonames.org/ontology#A”
“feature_Code”:”https://www.geonames.org/ontology#A.PCLI”

“broader.prefLabelFR”:”Asie orientale”
“broader.prefLabelEN”:”East Asia”
“narrower.prefLabelFR”:”Tokyo”
“narrower.prefLabelEN”:”Tokyo”

Voici ce qui est retourné dans le cadre du traitement Annotate avec le vocabulaire Pays et subdivisions (identifiant 9SD)

 

Données Résultats
Je suppose que l’on cherche dans le texte une occurrence d’un toponyme, comme le Canada ou un code pays comme JPN. ==> “termeReconnu”:”Canada”,
“prefLabel@en”: “Canada”,
“arbreHierarchique”:”1-World, 2-Americas, 3-North America, 4-Northern America
“frequence”:”1″”termeReconnu”:”JPN”,
“prefLabel@en”: “Japan”,
“arbreHierarchique”:”1-World, 2-Asia, 3-East Asia
“frequence”:”1″
En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres