Digitale Bibliotheek
Sluiten Bladeren door artikelen uit een tijdschrift
 
<< vorige    volgende >>
     Tijdschrift beschrijving
       Alle jaargangen van het bijbehorende tijdschrift
         Alle afleveringen van het bijbehorende jaargang
           Alle artikelen van de bijbehorende aflevering
                                       Details van artikel 2 van 8 gevonden artikelen
 
 
  An iterative refinement approach for data cleaning
 
 
Titel: An iterative refinement approach for data cleaning
Auteur: Karmaker, Amitava
Kwek, Stephen
Verschenen in: Intelligent data analysis
Paginering: Jaargang 11 (2007) nr. 5 pagina's 547-560
Jaar: 2007-10-16
Inhoud: Data cleaning is an important step in the data mining process. Successful data mining applications require good quality data. In this paper, we propose a data cleaning technique that smoothes out a substantial amount of attribute noise and handles missing attribute values as well. Our approach is inspired by the Expectation-Maximization (EM) algorithm. It iteratively refines each attribute-value using a predictor constructed from the previously refined values (known values in the first iteration). We demonstrate the effectiveness of our technique in smoothing out attribute noise and corroborate the efficacy of our technique by showing improved classification accuracy on a number of real world data sets from UCI repository [2]. Moreover, we show that our technique can easily be adapted to fill up missing attribute-values in classification problems more effectively than other standard approaches.
Uitgever: IOS Press
Bronbestand: Elektronische Wetenschappelijke Tijdschriften
 
 

                             Details van artikel 2 van 8 gevonden artikelen
 
<< vorige    volgende >>
 
 Koninklijke Bibliotheek - Nationale Bibliotheek van Nederland