astroTag - Extraction d’entités nommées en astronomie
Ce web service détecte des entités nommées en astronomie sur des textes en anglais et les répartit parmi les 16 classes suivantes :
Amas stellaires | Astéroïdes | Constellations | Étoiles |
Étoiles binaires (et pulsars) | Exoplanètes | Galaxies et amas de galaxies | Nébuleuses et régions apparentées |
Objets artificiels | Planètes | Satellites naturels | Statut hypothétique |
Supernovas | Sursauts radios, sources radios, autres sursauts | Système solaire | Trous noirs, quasars et apparentés |
Le modèle a été entrainé de manière supervisée avec la bibliothèque python Flair.
Les corpus d’entrainement et de test ont été créés à partir de données d’Istex annotées manuellement. Ces données ont été prétraitées pour correspondre au format attendu par Flair.
Il ne s’agit pas d’un corpus Gold.
Données annotées :
Le web service renvoie les entités réparties par classes sous la forme d’un tableau. Si aucune entité n’est trouvée dans le texte alors la valeur est vide {}.
Si aucun texte n’est présent dans la valeur d’entrée, alors le WS renvoie une sortie vide ""
Le modèle a une accuracy de 0,91. Cela signifie que dans 91% des cas, le service a retourné la bonne réponse.
Précaution
Le web service fonctionne uniquement sur du texte anglais.
Bibliothèque python Flair : https://huggingface.co/flair
Extraction d’entités géographiques
Extraction d’entités nommées de maladies
V643 Orionis is a binary star system located in the Orion constellation, offering valuable insightsinto stellar evolution. | ==> | Etoiles binaires (et pulsars): V643 Orionis Constellations: Orion |
If these planets had isothermal atmospheres, the light curves obtained during those occultations would have been smooth. Hence the presence of spikes in the light curves demonstrates immediately that the atmospheres of Jupiter and Neptune are not isothermal over distances much smaller than a scale height | ==> | Planete: Jupiter, Neptune |
This did not occur accidentally since g Carinae is one of the most luminous stars of the Galaxy. The environment of this extended object can be observed in very high angular (spatial) and spectral resolution simultaneously using the Hubble Space Telescope (HST) with its Space Telescope Imaging Spectrograph (STIS) on board (Kimble et al., 1988). | ==> | Objets artificiels: Hubble Space Telescope, HST Etoiles binaires (et pulsars): g Nebuleuse et region apparentes: Carinae |
The purportedly fastest star in the Gaia catalogue, Gaia DR2 5932173855446728064 (Bromley et al. 2018; Marchetti et al. 2019), has been found to be spurious (Boubert et al. 2019). | ==> | Objets artificiels: Gaia Etoiles: Gaia DR2 5932173855446728064 |
Vous avez un corpus consacré à l’astronomie et vous souhaitez en connaître le contenu de manière plus précise ?
En lançant astroTag sur vos données depuis Lodex, logiciel libre de visualisation, vous obtiendrez pour les 16 classes prédéfinies les principaux termes astronomiques et des représentations graphiques liées.
Graphes créés à partir des documents du corpus scientifique “Astroconcepts”.
Profitez en pour naviguer dans l’ensemble du corpus
et découvrez d’autres corpus scientifiques