国产精品久久久久久久久久东京,亚洲视频免费播放,少妇人妻精品一区二区三区视频,日韩一级品

好房網(wǎng)

網(wǎng)站首頁百科全書 >正文

數(shù)據(jù)預處理的四種方法(數(shù)據(jù)預處理的四種方式)

2022-07-07 16:12:48 百科全書來源:
導讀1、數(shù)據(jù)預處理的四種方式2、數(shù)據(jù)預處理的四種方式是:3、1.數(shù)據(jù)清理。數(shù)據(jù)清理例程通過填充缺失值、平滑噪聲數(shù)據(jù)、識別或刪除異常值以及解...

1、數(shù)據(jù)預處理的四種方式

2、數(shù)據(jù)預處理的四種方式是:

3、1.數(shù)據(jù)清理。數(shù)據(jù)清理例程通過填充缺失值、平滑噪聲數(shù)據(jù)、識別或刪除異常值以及解決不一致問題來“清理”數(shù)據(jù)。主要實現(xiàn)了以下目標:格式標準化、異常數(shù)據(jù)剔除、糾錯和重復數(shù)據(jù)剔除。

4、2.數(shù)據(jù)整合。數(shù)據(jù)集成例程組合來自多個數(shù)據(jù)源的數(shù)據(jù),并以統(tǒng)一的方式存儲它們。構(gòu)建數(shù)據(jù)倉庫的過程實際上就是數(shù)據(jù)集成。

5、3.數(shù)據(jù)轉(zhuǎn)換。通過平滑聚合、數(shù)據(jù)泛化和標準化,將數(shù)據(jù)轉(zhuǎn)換成適合數(shù)據(jù)挖掘的形式。

6、4.數(shù)據(jù)簡化。在挖掘數(shù)據(jù)的時候,數(shù)據(jù)量非常大,少量的數(shù)據(jù)挖掘和分析需要很長的時間。利用數(shù)據(jù)約簡技術(shù)可以得到數(shù)據(jù)集的約簡表示,約簡表示要小得多,但仍接近保持原始數(shù)據(jù)的完整性,結(jié)果與約簡前相同或幾乎相同。

7、數(shù)據(jù)預處理是指在主處理之前對數(shù)據(jù)的一些處理。主要任務是清理異常值,糾正錯誤數(shù)據(jù)?,F(xiàn)實世界中的數(shù)據(jù)一般都是不完整、不一致的臟數(shù)據(jù),無法直接挖掘,或者挖掘結(jié)果不盡如人意。為了提高數(shù)據(jù)挖掘的質(zhì)量,數(shù)據(jù)預處理技術(shù)得到了發(fā)展。

本文到此結(jié)束,希望對大家有所幫助。


版權(quán)說明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!


標簽:

熱點推薦
熱評文章
隨機文章