softwareTag - Extraction de noms de logiciels

Niveau d'utilisation :  Débutant
Niveau de validation :  Expérimental
Objectif

Ce web service détecte des noms de logiciels sur des textes en anglais.

Méthode

Le modèle utilisé par ce web service est un réseau de neurones entraîné en utilisant Flair sur le jeu de données softCite. Le code pour entraîner et évaluer le modèle est disponible à ce lien.

Métriques

Précaution : Le web service fonctionne uniquement sur du texte anglais.

Variantes

Vérifier si le logiciel extrait est open source

Précaution : cette variante est beaucoup plus lente : les résultats sont limités à 60 par minute.

Cette variante utilise l’API libraries.io pour vérifier la licence de chaque entité extraite. L’URL à utiliser pour cette variante est :
https://software-extract.services.istex.fr/v1/tagger-oa

Références

Le modèle a été entraîné en utilisant Flair.
Pour obtenir la licence des logiciels, nous utilisons l’API de Libraries.io.

Absent de TDM Factory
Traitement

Les entités nommées sont toutes renvoyées dans un champ “SOFT”.

This is a test text for the ner model. Model has to extract software such as BioImag Softr ==> BioImag Softr
An RNN-based model was designed using Python3 language with the PyTorch packages. ==> Python3, PyTorch.
En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres