Détection de la langue d’un texte

Complexité d'utilisation :  Facile
Niveau de validation :  Expérimental

Le web-service detect-lang détecte la langue d’un document texte et renvoie le code langue et la probabilité correspondante. Dans le cas où le résultat est trop incertain, le service renverra unknown.

À noter que la détection de langue a besoin d’un texte suffisamment long pour fonctionner correctement. Avec un nombre de mots trop réduit le résultat sera très incertain.

Le code langue renvoyé correspond aux étiquettes d’identification de langues IETF que l’on peut trouver ici.

La capture d’écran ci-contre illustre l’utilisation de ce web-service dans Lodex en saisissant son url

Exemple textuel du traitement
Le format d'entrée :
[
  {
    "id": 1,
    "value": "Primero, caminó por La Rambla, la calle más famosa de Barcelona, llena de gente, tiendas y restaurantes."
  },
  {
    "id": 2,
    "value": "The latter is tested in the presence and absence of vectors in order to check that they do not inhibit the detection of recombinants."
  }
]
Le résultat :

Le résultat  donne le code langue détecté, « unknown » dans le cas ou le résultat est incertain.

[
  {
    "id": 1,
    "value": "es"
  },
  {
    "id": 2,
    "value": "en"
  }
]