Grobid - Extraction et structuration de publication scientifique au format PDF
Niveau d'utilisation :
Débutant
Niveau de validation :
Validé
Objectif
Ce service extrait le texte d’une publication scientifique au format PDF et le structure au format XML-TEI avec l’API de Grobid.
Méthode
Ce service utilise l’API de Grobid pour extraire et structurer un article scientifique au format PDF. GeneRation Of BIbliographic Data …. Cela signifie que toutes les informations contenues dans l’article (titre, résumé, auteurs, affiliations, texte plein, références bibliographiques, … etc) sont mises dans des balises correspondantes.
Références
Grobid (2008-2026), https://github.com/kermitt2/grobid
Ces web services qui peuvent vous intéresser
Présent sur TDM Factory
LIEN VERS TDM FACTORY
Aller à TDM Factory
Utilisation dans TDM Factory
Ce web service se lance uniquement sur un article au format PDF.
Absent de Lodex

