Paulin Melatagia Yonta ; Michael Franklin Mbouopda
-
Roconnaissance des Entités Nommées En Langues Peu Dotées En Utilisant La Représentation Distributionnelle Multiligue
arima:6439 -
Revue Africaine de Recherche en Informatique et Mathématiques Appliquées,
29 septembre 2020,
Volume 33 - Numéro spécial CRI 2019 - 2020-21
-
https://doi.org/10.46298/arima.6439
Roconnaissance des Entités Nommées En Langues Peu Dotées En Utilisant La Représentation Distributionnelle MultiligueArticle
Auteurs : Paulin Melatagia Yonta 1; Michael Franklin Mbouopda 1
La reconnaissance des entités nommées (REN) est une tâche fondamentale du TALN dont le but est d'identifier les expressions telles que les noms de personnes, de lieux et d'organisations dans un texte. Il existe de nos jours plusieurs systèmes de REN, cependant les données nécessaires pour les utiliser dans le traitement des langues peu dotées telles que les langues camerounaises ne sont pas disponibles. Nous exploitons le fait que les entités nommées apparaissent rarement dans les textes pour définir une nouvelle représentation distributionnelle interlingue des mots, qui soit adaptée à la REN. En utilisant notre représentation, nous projectons les entités nommées de l'anglais vers l'ewondo (une langue bantou du Cameroun); nous obtenons donc le tout premier modèle de reconnaissance des entités nommées en langue ewondo. Les résultats en terme de précision, rappel et f-mesure montrent l'efficacité de notre représentation