国产精品久久久久久久久久东京,亚洲视频免费播放,少妇人妻精品一区二区三区视频,日韩一级品

好房網(wǎng)

網(wǎng)站首頁百科全書 >正文

數(shù)據(jù)預(yù)處理的工具有哪些(數(shù)據(jù)預(yù)處理技術(shù)有哪些)

2022-07-04 12:15:13 百科全書來源:
導(dǎo)讀1、數(shù)據(jù)預(yù)處理技術(shù)有哪些2、有四種數(shù)據(jù)預(yù)處理技術(shù):3、1.數(shù)據(jù)清理。空缺值處理、格式標(biāo)準(zhǔn)化、異常數(shù)據(jù)消除、錯誤校正和重復(fù)數(shù)據(jù)消除。4、2....

1、數(shù)據(jù)預(yù)處理技術(shù)有哪些

2、有四種數(shù)據(jù)預(yù)處理技術(shù):

3、1.數(shù)據(jù)清理??杖敝堤幚怼⒏袷綐?biāo)準(zhǔn)化、異常數(shù)據(jù)消除、錯誤校正和重復(fù)數(shù)據(jù)消除。

4、2.數(shù)據(jù)整合。將來自多個數(shù)據(jù)源的數(shù)據(jù)組合起來,以統(tǒng)一的方式存儲,構(gòu)建數(shù)據(jù)倉庫的過程實際上就是數(shù)據(jù)集成。

5、3.數(shù)據(jù)轉(zhuǎn)換。平滑、聚合、歸一化、最小-最大歸一化等。

6、4.數(shù)據(jù)簡化。降維(刪除無關(guān)屬性(維度))、數(shù)據(jù)壓縮(PCA、LDA、SVD、小波變換)、數(shù)值降維(回歸和對數(shù)線性模型、線性回歸、對數(shù)線性模型、直方圖)。

7、現(xiàn)實中,世界上的數(shù)據(jù)一般都是不完整、不一致的臟數(shù)據(jù),無法直接挖掘,或者挖掘結(jié)果不盡如人意。為了提高數(shù)據(jù)挖掘的質(zhì)量,數(shù)據(jù)預(yù)處理技術(shù)得到了發(fā)展。數(shù)據(jù)預(yù)處理的方法有很多:數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)歸約等。這些數(shù)據(jù)處理技術(shù)是在數(shù)據(jù)挖掘之前使用的,大大提高了數(shù)據(jù)挖掘模式的質(zhì)量,減少了實際挖掘所需的時間。數(shù)據(jù)清理例程通過填充缺失值、平滑噪聲數(shù)據(jù)、識別或刪除異常值以及解決不一致來“清理”數(shù)據(jù)。主要實現(xiàn)了以下目標(biāo):格式標(biāo)準(zhǔn)化、異常數(shù)據(jù)剔除、糾錯和重復(fù)數(shù)據(jù)剔除。在挖掘數(shù)據(jù)的時候,數(shù)據(jù)量非常大,少量的數(shù)據(jù)挖掘和分析需要很長的時間。利用數(shù)據(jù)約簡技術(shù)可以得到數(shù)據(jù)集的約簡表示,約簡表示要小得多,但仍接近保持原始數(shù)據(jù)的完整性,結(jié)果與約簡前相同或幾乎相同。

本文到此結(jié)束,希望對大家有所幫助。


版權(quán)說明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!


標(biāo)簽:

熱點推薦
熱評文章
隨機文章