Approche hiérarchique d’extraction des compétences dans des CVs en format PDF

Florentin Flambeau Jiechieu Kameni; Norbert Tsopze

doi:10.46298/arima.4964

Florentin Flambeau Jiechieu Kameni ; Norbert Tsopze - Approche hiérarchique d’extraction des compétences dans des CVs en format PDF

arima:4964 - Revue Africaine de Recherche en Informatique et Mathématiques Appliquées, 3 octobre 2019, Volume 32 - 2019 - 2021 - https://doi.org/10.46298/arima.4964

Approche hiérarchique d’extraction des compétences dans des CVs en format PDFArticle

Auteurs : Florentin Flambeau Jiechieu Kameni ¹; Norbert Tsopze ¹

1 Unité de modélisation mathématique et informatique des systèmes complexes [Bondy]

L’objectif de ce travail est d’utiliser l’approche héirarchique d’extraction des informations dans le CV pour en extraire les compétences. L’approche d’extraction des compétences proposée s’effectue en deux grandes phases : une phase de segmentation du CV en sections classées suivant leurs contenus et à partir desquelles les termes représentant les compétences (compétences de bases) sont extraits; et une phase de prédiction qui consiste à partir des caractéristiques extraites précédemment, à prédire un ensemble de compétences qu’un expert aurait déduites, et que ces compétences ne seraient pas nécessairement mentionnées dans le CV (compétences implicites). Les principales contributions de ce travail sont : l’utilisation de l’approche hiérarchique de segmentation du CV en sections pour extraire les compétences dans le CV; l’amélioration de la l’approche de segmentation des CV; enfin, l’utilisation de l’approche binary relevance de classification multi-label pour prédire les compétences implicites du CV. Les expérimentations effectuées sur un jeu de CVs collectés sur Internet ont montré une amélioration de la précision de l’identification des blocs de plus de 10% comparé à un modèle de l’état de l’art. Aussi, le modèle de prédiction multi-label des compétences, permet de retrouver la liste des compétences avec une précision et un rappel respectivement de l’ordre de 90,5% et 92,3%.

https://doi.org/10.46298/arima.4964

Source : HAL:hal-01898913v3

Volume : Volume 32 - 2019 - 2021

Publié le : 3 octobre 2019

Accepté le : 29 août 2019

Soumis le : 12 novembre 2018

Mots-clés : Skill Gap,Resume,Skills Extraction,Multi-label classification,Skill Gap,CV,Extraction des Compétences,Classification Multi-label,[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI]

Florentin Flambeau Jiechieu Kameni ; Norbert Tsopze - Approche hiérarchique d’extraction des compétences dans des CVs en format PDF

Références bibliographiques

1 Document citant cet article

Partager et exporter

Statistiques de consultation