国产精品久久久久久久久久东京,亚洲视频免费播放,少妇人妻精品一区二区三区视频,日韩一级品

好房網(wǎng)

網(wǎng)站首頁百科全書 >正文

數(shù)據(jù)預(yù)處理的內(nèi)容包括哪些(數(shù)據(jù)預(yù)處理包括哪些內(nèi)容)

2022-07-17 00:22:59 百科全書來源:
導(dǎo)讀1、數(shù)據(jù)預(yù)處理包括哪些內(nèi)容2、數(shù)據(jù)后處理是指在主處理之前的一些數(shù)據(jù)處理,包括:3、1.數(shù)據(jù)清理。數(shù)據(jù)清理例程通過填充缺失值、平滑噪聲數(shù)...

1、數(shù)據(jù)預(yù)處理包括哪些內(nèi)容

2、數(shù)據(jù)后處理是指在主處理之前的一些數(shù)據(jù)處理,包括:

3、1.數(shù)據(jù)清理。數(shù)據(jù)清理例程通過填充缺失值、平滑噪聲數(shù)據(jù)、識(shí)別或刪除異常值以及解決不一致問題來“清理”數(shù)據(jù)。主要實(shí)現(xiàn)了以下目標(biāo):格式標(biāo)準(zhǔn)化、異常數(shù)據(jù)剔除、糾錯(cuò)和重復(fù)數(shù)據(jù)剔除。

4、2.數(shù)據(jù)整合。數(shù)據(jù)集成例程組合來自多個(gè)數(shù)據(jù)源的數(shù)據(jù),并以統(tǒng)一的方式存儲(chǔ)它們。構(gòu)建數(shù)據(jù)倉庫的過程實(shí)際上就是數(shù)據(jù)集成。

5、3.數(shù)據(jù)轉(zhuǎn)換。通過平滑聚合、數(shù)據(jù)泛化和標(biāo)準(zhǔn)化,將數(shù)據(jù)轉(zhuǎn)換成適合數(shù)據(jù)挖掘的形式。

6、4.數(shù)據(jù)簡化。在挖掘數(shù)據(jù)的時(shí)候,數(shù)據(jù)量非常大,少量的數(shù)據(jù)挖掘和分析需要很長的時(shí)間。利用數(shù)據(jù)約簡技術(shù)可以得到數(shù)據(jù)集的約簡表示,約簡表示要小得多,但仍接近保持原始數(shù)據(jù)的完整性,結(jié)果與約簡前相同或幾乎相同。

7、數(shù)據(jù)預(yù)處理是指在主處理之前對(duì)數(shù)據(jù)的一些處理。主要任務(wù)是清理異常值,糾正錯(cuò)誤數(shù)據(jù)?,F(xiàn)實(shí)世界中的數(shù)據(jù)一般都是不完整、不一致的臟數(shù)據(jù),無法直接挖掘,或者挖掘結(jié)果不盡如人意。為了提高數(shù)據(jù)挖掘的質(zhì)量,數(shù)據(jù)預(yù)處理技術(shù)得到了發(fā)展。數(shù)據(jù)預(yù)處理的方法有很多:數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)歸約等。這些數(shù)據(jù)處理技術(shù)是在數(shù)據(jù)挖掘之前使用的,大大提高了數(shù)據(jù)挖掘模式的質(zhì)量,減少了實(shí)際挖掘所需的時(shí)間。

本文到此結(jié)束,希望對(duì)大家有所幫助。


版權(quán)說明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!


標(biāo)簽:

最新文章:

熱點(diǎn)推薦
熱評(píng)文章
隨機(jī)文章