Classification en domaines scientifiques Pascal-Francis

Niveau d'utilisation :  Débutant
Niveau de validation :  Expérimental
Objectif

Le web service de classification automatique classe des documents scientifiques en anglais dans le plan de classement Pascal (Sciences, Techniques et Médecine) ou Francis (Sciences Humaines et Sociales). Après traitement, chaque document possède un domaine scientifique homogène, dans la mesure où les données de départ ont permis ce traitement.

Méthode

Le classifier applique une démarche supervisée en apprenant à prédire des domaines en s’appuyant sur un corpus de documents contenant les domaines à prédire. Le corpus d’entraînement utilisé est constitué de notices bibliographiques extraites des bases de données Pascal/Francis 

Variante

Il est possible de varier la profondeur de la prédiction dans le plan de classement. Celle-ci est par défaut fixée à 3. Pour en changer, il suffit de suffixer l’URL par ?deep=X ou X varie entre 1 et 3.

Exemple: https://domains-classifier-2.services.istex.fr/v1/en/classify?deep=2

 

Exemple textuel du traitement
Le format d'entrée :
[
  {
    "idt": "08-040289",
    "value": "Planck 2015 results. XIII. Cosmological parameters.We present results based on full-mission Planck observations of temperature and polarization anisotropies of the CMB. These data are consistent with the six-parameter inflationary LCDM cosmology. From the Planck temperature and lensing data, for this cosmology we find a Hubble constant, H0= (67.8 +/- 0.9) km/s/Mpc, a matter density parameter Omega_m = 0.308 +/- 0.012 and a scalar spectral index with n_s = 0.968 +/- 0.006. (We quote 68% errors on measured parameters and 95% limits on other parameters.) Combined with Planck temperature and lensing data, Planck LFI polarization measurements lead to a reionization optical depth of tau = 0.066 +/- 0.016. Combining Planck with other astrophysical data we find N_ eff = 3.15 +/- 0.23 for the effective number of relativistic degrees of freedom and the sum of neutrino masses is constrained to < 0.23 eV. Spatial curvature is found to be |Omega_K| < 0.005. For LCDM we find a limit on the tensor-to-scalar ratio of r <0.11 consistent with the B-mode constraints from an analysis of BICEP2, Keck Array, and Planck (BKP) data. Adding the BKP data leads to a tighter constraint of r < 0.09. We find no evidence for isocurvature perturbations or cosmic defects. The equation of state of dark energy is constrained to w = -1.006 +/- 0.045. Standard big bang nucleosynthesis predictions for the Planck LCDM cosmology are in excellent agreement with observations. We investigate annihilating dark matter and deviations from standard recombination, finding no evidence for new physics. The Planck results for base LCDM are in agreement with BAO data and with the JLA SNe sample. However the amplitude of the fluctuations is found to be higher than inferred from rich cluster counts and weak gravitational lensing. Apart from these tensions, the base LCDM cosmology provides an excellent description of the Planck CMB observations and many other astrophysical data sets."
  }
]
Le résultat :

En format json il reprend l’identifiant du document initial et donne l’arborescence du domaine scientifique du document sur un maximum de 3 niveaux (rang).

[{
    "idt": "08-040289",
    "value": [
        {
            "code": {
                "id": "001",
                "value": "Sciences exactes et technologie."
            },
            "confidence": 1.0000057220458984,
            "rang": 1
        },
        {
            "code": {
                "id": "001E",
                "value": "Terre, océan, espace."
            },
            "confidence": 0.9999549388885498,
            "rang": 2
        },
        {
            "code": {
                "id": "001E03",
                "value": "Astronomie."
            },
            "confidence": 1.0000100135803223,
            "rang": 3
}]
En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres