textNormalize - Normalisation d’un texte ou d’un terme

Niveau d'utilisation :  Débutant
Niveau de validation :  Expérimental
Objectif

Ce web service normalise un texte, un terme ou plus généralement une chaîne de caractères.

Ce web service fonctionne quelle que soit la langue du texte, à condition qu’elle soit dans un alphabet latin.

Méthode

La normalisation sous-entend supprimer les caractères accentués, les caractères spéciaux, les espaces inutiles et redondants pour in fine mettre tous les caractères en majuscules.

Exemple textuel du traitement
Le format d'entrée :
[
  {
    "id": 1,
    "value": "café !"
  },
  {
    "id": 2,
    "value": "Côte d'Ivoire"
  },
  {
    "id": 3,
    "value": "Le café (de l'arabe قهوة : qahwa, 'boisson stimulante') est une boisson énergisante psychotrope stimulante, obtenue à partir des graines torréfiées de diverses variétés de caféier, de l'arbuste caféier, du genre Coffea. Il fait partie des trois principales boissons contenant de la caféine les plus consommées dans le monde, avec le thé et le maté."
  }
]
Le résultat :
[
  {
    "id": 1,
    "value": "CAFE"
  },
  {
    "id": 2,
    "value": "COTE D IVOIRE"
  },
  {
    "id": 3,
    "value": "LE CAFE DE L ARABE قهوة QAHWA BOISSON STIMULANTE EST UNE BOISSON ENERGISANTE PSYCHOTROPE STIMULANTE OBTENUE A PARTIR DES GRAINES TORREFIEES DE DIVERSES VARIETES DE CAFEIER DE L ARBUSTE CAFEIER DU GENRE COFFEA IL FAIT PARTIE DES TROIS PRINCIPALES BOISSONS CONTENANT DE LA CAFEINE LES PLUS CONSOMMEES DANS LE MONDE AVEC LE THE ET LE MATE"
  }
]

Ce service peut servir dans Lodex à la génération de facettes en regroupant les valeurs des champs qui sont proches par leurs graphies.

En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres