genderDetect - Détection du genre de l’auteur

Niveau d'utilisation :  Débutant
Niveau de validation :  Expérimental
Objectif

Ce web service retourne le genre d’un auteur ou d’une autrice à partir d’un prénom.

Méthode

Les formats de prénoms pris en compte sont les suivants :

"prénom"
"prénom nom"
"prénom, nom"

Plusieurs sorties sont possibles :

  • masculin : le prénom est masculin
  • feminin : le prénom est féminin
  • mixte_masculin : le prénom est mixte mais majoritairement porté par des hommes
  • mixte_feminin : le prénom est mixte mais majoritairement porté par des femmes
  • mixte : le prénom est mixte
  • unknown : le prénom n’est pas dans nos données ou mal formé (ex: une initiale)

Notre liste “genre-prénom” est un mélange entre les données issues de la bibliothèque python gender-guesser et des données issues de la plateforme Kaggle :

  • Gender-guesser : regroupe plus de 40000 prénoms internationaux avec le genre associé et
  • Kaggle : regroupe les données des prénoms des bébés français et leur genre de 1900 à 2018 (INSEE)

Ces données ont été fusionnées dans un pré-traitement et enregistrées sous la forme d’un dictionnaire avec les prénoms en clé et les genres en valeurs :

{"Jean-Claude":"masculin", "Amke":"mixte_féminin", "Valentyne" : "unknown"}

Le genre d’un prénom peut être différent selon le pays. Ainsi nous avons fait le choix de sélectionner le genre le plus fréquent dans le monde.

 

Références

Source des données :

 

Article associé :

Exemple textuel du traitement
Le format d'entrée :
[
    {"id": "1", "value": "Valentyne, Dupont"},
    {"id": "2", "value": "Amke"},
    {"id": "3", "value": "Seong-Eun Park"},
    {"id": "4", "value": "James A."}
]
Le résultat :
[
  {"id": "1", "value": "unknown"},
  {"id": "2", "value": "mixte_feminin"},
  {"id": "3", "value": "feminin"},
  {"id": "4", "value": "masculin"}
]

Vous souhaitez réaliser une répartition des publications par genre ? Vous souhaitez voir la progression de cette répartition par genre ?
Vous souhaitez savoir si les membres de votre organisme privilégient un genre pour copublier ?
En lançant genderDetect sur vos données depuis Lodex, logiciel libre de visualisation, vous obtiendrez le genre des prénoms des auteurs et des représentations graphiques liées.

Graphes issus d’une étude réalisée pour l’I2BC (Institut de Biologie Intégrative de la Cellule — Production scientifique 2013-2023) et d’une étude réalisée pour l’Université Bordeaux Montaigne (Production scientifique 2018-2023)

En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres