topRefExtract - Extraction des références phares d’un corpus
Ce web service identifie, par défaut, les 10 publications les plus citées dans un corpus donné, qu’elles fassent partie ou non du corpus d’origine.
Le web service prend en entrée une liste de DOI. Pour chaque DOI, il interroge l’API OpenAlex pour récupérer la notice correspondante. Cette notice contient plusieurs champs, dont le champ “referenced_works” qui liste les publications citées par l’article.
Si le WS renvoie “champ reference_works vide“, celui peut signifier soit que le champ est vide soit que la publication n’est pas en accès ouvert.
Ensuite, le service regroupe toutes ces citations et identifie celles qui sont les plus citées.
Enfin, le web service renvoie les N publications les plus citées (par défaut 10), en précisant le nombre de citations pour chacune d’entre elles ainsi que les DOI des articles qui les ont citées.
Nombre de citations
Le paramètre nbCitations est facultatif et par défaut à 10.
Pour obtenir les 4 citations les plus citées, il est nécessaire de rajouter ?nbCitations=4 à la fin de l’URL :
https://data-topcitation.services.istex.fr/v1/topcitation?nbCitations=4
Utilisation de l’API OpenAlex
Utilisation dans TDM Factory
Ce web service se lance sur :
- un corpus Istex au format targz
- un corpus au format CSV
Utilisation dans Lodex
Sélectionnez le web service dans le catalogue :
Précalcul : le web service traite le corpus dans sa globalité. Le résultat obtenu pour chaque document dépend des autres. Exemple pour la génération de clusters. On parlera de web service asynchrone
* Si vous souhaitez les 10 citations les plus citées par défaut
Saisir cette URL https://data-topcitation.services.istex.fr/v1/topcitation et sélectionner la colonne dédiée aux citations.
Sauvegarder et lancer le traitement
* Si vous souhaitez le nombre de citations les plus citées
Saisir cette URL https://data-topcitation.services.istex.fr/v1/topcitation?nbCitations=4 et sélectionner la colonne dédiée aux citations.
Sauvegarder et lancer le traitement
Ce web service ne traite pas des fichiers mais des corpus : ceci est un exemple de contenu d’un fichier d’un corpus
| Liste de DOIs | ==> | id: https://doi.org/10.1126/science.235.4788.567, count: 2, citing_doi: https://doi.org/10.1126/science.235.4793.1196, https://doi.org/10.1103/physrevlett.58.908id: https://doi.org/10.1088/0370-1298/62/7/303, count: 2, citing_doi: https://doi.org/10.1126/science.235.4793.1196, https://doi.org/10.1103/revmodphys.70.1039 id: https://doi.org/10.1103/physrevlett.58.408, |
PS : Il s’agit de la sortie brute du traitement, et non celle obtenue dans Lodex.