A Comparative study of sample selection methods for classification

Patricia E.N. Lutu; Andries P. Engelbrecht

doi:10.46298/arima.1880

Patricia E.N. Lutu ; Andries P. Engelbrecht - A Comparative study of sample selection methods for classification

arima:1880 - Revue Africaine de Recherche en Informatique et Mathématiques Appliquées, 2 septembre 2007, Volume 6, april 2007, joint Special Issue ARIMA/SACJ on Advances in end-user data mining techniques - https://doi.org/10.46298/arima.1880

A Comparative study of sample selection methods for classificationArticle

Auteurs : Patricia E.N. Lutu ¹; Andries P. Engelbrecht ¹

1 Department of Informatics [Pretoria]

L’échantillonnage pour le minage de large ensemble de données est important pour au moins deux raisons. Le traitement de grande quantité de données a pour résultat une augmentation de la complexité informatique. Le coût de cette complexité additionnelle pourrait être non justifiable. D’autre part, l’utilisation de petits échantillons a pour résultat des calculs rapides et efficaces pour les algorithmes de minage de données. Les méthodes de statistique pour obtenir des échantillons d’ensemble de donnés satisfaisants pour les problèmes de classification sont discutées dans ce papier. Des résultats sont présentés pour une étude empirique basée sur l’utilisation d’échantillonnage aléatoire séquentiel et l’évaluation d’échantillon utilisant le test d’hypothèse univariée et une mesure théorétique de l’information. Des comparaisons sont faites entre des estimations théoriques et empiriques

https://doi.org/10.46298/arima.1880

Source : HAL:hal-01262348v1

Volume : Volume 6, april 2007, joint Special Issue ARIMA/SACJ on Advances in end-user data mining techniques

Publié le : 2 septembre 2007

Soumis le : 16 février 2007

Mots-clés : dataset sampling, data analysis, machine learning, classification, information measures,échantillonnage d’ensemble de données,analyse de données,apprentissage de machine,classification,[INFO]Computer Science [cs],[MATH]Mathematics [math]

Patricia E.N. Lutu ; Andries P. Engelbrecht - A Comparative study of sample selection methods for classification

Références bibliographiques

Partager et exporter

Statistiques de consultation