Marwa Naili ; Anja Chaibi ; Henda Ghézala
-
Identification thématique Arabe basée sur des études empiriques des topic models
arima:3102 -
Revue Africaine de Recherche en Informatique et Mathématiques Appliquées,
3 août 2017,
Volume 27 - 2017 - Numéro spécial CARI 2016
-
https://doi.org/10.46298/arima.3102
Identification thématique Arabe basée sur des études empiriques des topic modelsArticle
1 Laboratoire de recherche en Génie Logiciel, Applications distribuées, Systèmes décisionnels et Imagerie intelligente [Manouba]
Cet article met l'accent sur l'identification thématique pour la langue arabe basée sur les topic models. Nous étudions l'Allocation de Dirichlet Latente (LDA) comme une méthode non supervisée pour l'identification thématique. Ainsi, une étude approfondie de LDA a été effectuée à deux niveaux: le processus de lemmatisation et le choix des hyper-paramètres. Pour le premier niveau, nous étudions l'effet des différents lemmatiseurs sur LDA. Pour le deuxième niveau, nous nous focalisons sur les hyper-paramètres α et β de LDA et leurs impacts sur l'identification. Cette étude montre que LDA est une méthode efficace pour l'identification thématique Arabe surtout avec le bon choix des hyper-paramètres. Un autre résultat important est l'impact élevé de l'algorithme de lemmatisation sur l'identification thématique.
Myeong Seon Lee;Hyun-Sook Chung;Jin Sun Kim, 2023, Analysis of online parenting community posts on expanded newborn screening for metabolic disorders using topic modeling: a quantitative content analysis, Korean journal of women health nursing/Yeoseong geon'gang ganho hag'hoeji/Yeoseong geon-gang ganho hakoeji, 29, 1, pp. 20-31, 10.4069/kjwhn.2023.02.21, https://doi.org/10.4069/kjwhn.2023.02.21.
Dong-Joon Jung, 2022, Political Polarization on Social Media Conversations about COVID-19 Vaccination: Evidence from the Word Network Analysis and Topic Modeling of Twitter Messages in South Korea, Journal of Social Science, 33, 2, pp. 85-123, 10.16881/jss.2022.04.33.2.85.
Mohammed A. AlGhamdi;Murtaza Ali Khan, 2020, Intelligent Analysis of Arabic Tweets for Detection of Suspicious Messages, Arabian Journal for Science and Engineering, 45, 8, pp. 6021-6032, 10.1007/s13369-020-04447-0.