Toufik Sari ; Mokhtar Sellami - Correction des erreurs orthographiques des systèmes de reconnaissance de l'écriture et de la parole arabe

arima:2555 - Revue Africaine de Recherche en Informatique et Mathématiques Appliquées, 22 octobre 2004, Volume 2, 2004-2005 - https://doi.org/10.46298/arima.2555
Correction des erreurs orthographiques des systèmes de reconnaissance de l'écriture et de la parole arabeArticle

Auteurs : Toufik Sari 1; Mokhtar Sellami 1

  • 1 Laboratoire de Recherche informatique - Badji Mokhtar University

Nous proposons dans cet article deux méthodes universelles de post-traitement pour la correction des mots arabes issus des systèmes de reconnaissance de textes et de parole arabes. Elles sont conçues à être adaptables. Ces approches corrigent les erreurs de type rejet et substitution. L'une d'elles est étroitement liée au dictionnaire elle est dite guidée par le lexique, l'autre, guidée par le contexte, est plus générale exploitant les information contextuelles. Les propriétés de la langue arabe sont très utiles en analyse morpho-lexicale et par conséquent elles sont fortement exploitées dans le développement de la deuxième méthode. Les erreurs de substitution sont réécrites sous formes de règles de production et utilisées par un système de production. Les extensions aux autres niveaux du traitement du langage sont envisagées en perspectives.


Volume : Volume 2, 2004-2005
Publié le : 22 octobre 2004
Soumis le : 26 mars 2004
Mots-clés : Arabic character recognition, error detection, word correction, arabic linguistic, probabilistic rule-based techniques, post-processing.,OCR arabe,détection des erreurs,correction des mots,langue arabe,analyse morpho-lexicale,post-traitement,base de règles.,[INFO] Computer Science [cs],[MATH] Mathematics [math]

Statistiques de consultation

Cette page a été consultée 256 fois.
Le PDF de cet article a été téléchargé 433 fois.