topRefExtract - Extraction des références phares d’un corpus

Malgré les contrôles qualité que nous effectuons avant de mettre nos web services en production, les outils d'IA peuvent commettre des erreurs. Nous vous recommandons de vérifier les informations importantes.

Niveau d'utilisation :  Débutant
Niveau de validation :  Expérimental
Objectif

Ce web service identifie, par défaut, les 10 publications les plus citées dans un corpus donné, qu’elles fassent partie ou non du corpus d’origine.

Méthode

Le web service prend en entrée une liste de DOI. Pour chaque DOI, il interroge l’API OpenAlex pour récupérer la notice correspondante. Cette notice contient plusieurs champs, dont le champ “referenced_works” qui liste les publications citées par l’article.

Si le WS renvoie “champ reference_works vide“, celui peut signifier soit que le champ est vide soit que la publication n’est pas en accès ouvert.

Ensuite, le service regroupe toutes ces citations et identifie celles qui sont les plus citées.

Enfin, le web service renvoie les N publications les plus citées (par défaut 10), en précisant le nombre de citations pour chacune d’entre elles ainsi que les DOI des articles qui les ont citées.

Variantes

Nombre de citations

Le paramètre nbCitations est facultatif et par défaut à 10.
Pour obtenir les 4 citations les plus citées, il est nécessaire de rajouter ?nbCitations=4 à la fin de l’URL :

https://data-topcitation.services.istex.fr/v1/topcitation?nbCitations=4

Références

Utilisation de l’API OpenAlex

Ces web services qui peuvent vous intéresser

Vérification de référence bibliographique

Présent sur TDM Factory

Utilisation dans TDM Factory

Ce web service se lance sur :

  • un corpus Istex au format targz
  • un corpus au format CSV
Présent sur Lodex

Utilisation dans Lodex

Sélectionnez le web service dans le catalogue :

Précalcul : le web service traite le corpus dans sa globalité. Le résultat obtenu pour chaque document dépend des autres. Exemple pour la génération de clusters. On parlera de web service asynchrone

* Si vous souhaitez les 10 citations les plus citées par défaut

Saisir cette URL https://data-topcitation.services.istex.fr/v1/topcitation et sélectionner la colonne dédiée aux citations.
Sauvegarder et lancer le traitement

* Si vous souhaitez le nombre de citations les plus citées

Saisir cette URL https://data-topcitation.services.istex.fr/v1/topcitation?nbCitations=4 et sélectionner la colonne dédiée aux citations.
Sauvegarder et lancer le traitement

Traitement

Ce web service ne traite pas des fichiers mais des corpus : ceci est un exemple de contenu d’un fichier d’un corpus

Liste de DOIs ==> id: https://doi.org/10.1126/science.235.4788.567,
count: 2,
citing_doi:
https://doi.org/10.1126/science.235.4793.1196,
https://doi.org/10.1103/physrevlett.58.908id: https://doi.org/10.1088/0370-1298/62/7/303,
count: 2,
citing_doi:
https://doi.org/10.1126/science.235.4793.1196,
https://doi.org/10.1103/revmodphys.70.1039

id: https://doi.org/10.1103/physrevlett.58.408,
count: 2,
citing_doi:
https://doi.org/10.1126/science.235.4793.1196,
https://doi.org/10.1103/physrevlett.58.908

PS : Il s’agit de la sortie brute du traitement, et non celle obtenue dans Lodex.

En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres