国产精品久久久久久久久久东京,亚洲视频免费播放,少妇人妻精品一区二区三区视频,日韩一级品

好房網(wǎng)

網(wǎng)站首頁(yè) 互聯(lián)網(wǎng) > 正文

你知道機(jī)器學(xué)習(xí)建模的步驟嗎

2022-09-29 01:14:38 互聯(lián)網(wǎng) 來(lái)源:
導(dǎo)讀 今天小編來(lái)給大家分享一些關(guān)于機(jī)器學(xué)習(xí)建模步驟 你知道嗎方面的知識(shí)吧,希望大家會(huì)喜歡哦 1、實(shí)際問(wèn)題抽象成數(shù)學(xué)問(wèn)題:這里的抽象成數(shù)學(xué)

今天小編來(lái)給大家分享一些關(guān)于機(jī)器學(xué)習(xí)建模步驟 你知道嗎方面的知識(shí)吧,希望大家會(huì)喜歡哦

1、實(shí)際問(wèn)題抽象成數(shù)學(xué)問(wèn)題:這里的抽象成數(shù)學(xué)問(wèn)題,指的我們明確我們可以獲得什么樣的數(shù)據(jù),目標(biāo)是一個(gè)分類(lèi)還是回歸或者是聚類(lèi)的問(wèn)題,如果都不是的話,如果劃歸為其中的某類(lèi)問(wèn)題。

2、獲取數(shù)據(jù):獲取數(shù)據(jù)包括獲取原始數(shù)據(jù)以及從原始數(shù)據(jù)中經(jīng)過(guò)特征工程從原始數(shù)據(jù)中提取訓(xùn)練、測(cè)試數(shù)據(jù)。機(jī)器學(xué)習(xí)比賽中原始數(shù)據(jù)都是直接提供的,但是實(shí)際問(wèn)題需要自己獲得原始數(shù)據(jù)。“ 數(shù)據(jù)決定機(jī)器學(xué)習(xí)結(jié)果的上限,而算法只是盡可能的逼近這個(gè)上限”,可見(jiàn)數(shù)據(jù)在機(jī)器學(xué)習(xí)中的作用??偟膩?lái)說(shuō)數(shù)據(jù)要有具有“代表性”,對(duì)于分類(lèi)問(wèn)題,數(shù)據(jù)偏斜不能過(guò)于嚴(yán)重,不同類(lèi)別的數(shù)據(jù)數(shù)量不要有數(shù)個(gè)數(shù)量級(jí)的差距。 對(duì)評(píng)估數(shù)據(jù)的量級(jí),樣本數(shù)量、特征數(shù)量,估算訓(xùn)練模型對(duì)內(nèi)存的消耗。如果數(shù)據(jù)量太大可以考慮減少訓(xùn)練樣本、降維或者使用分布式機(jī)器學(xué)習(xí)系統(tǒng)。

3、特征工程:特征工程包括從原始數(shù)據(jù)中特征構(gòu)建、特征提取、特征選擇、特征工程做的好能發(fā)揮原始數(shù)據(jù)的最大效力,往往能夠使得算法的效果和性能得到顯著的提升,有時(shí)能使簡(jiǎn)單的模型的效果比復(fù)雜的模型效果好。數(shù)據(jù)挖掘的大部分時(shí)間就花在特征工程上面,是機(jī)器學(xué)習(xí)非?;A(chǔ)而又必備的步驟。數(shù)據(jù)預(yù)處理、數(shù)據(jù)清洗、篩選顯著特征、摒棄非顯著特征等。訓(xùn)練模型、診斷、調(diào)優(yōu)模型診斷中至關(guān)重要的是判斷過(guò)擬合、欠擬合,常見(jiàn)的方法是繪制學(xué)習(xí)曲線,交叉驗(yàn)證。通過(guò)增加訓(xùn)練的數(shù)據(jù)量、降低模型復(fù)雜度來(lái)降低過(guò)擬合的風(fēng)險(xiǎn),提高特征的數(shù)量和質(zhì)量、增加模型復(fù)雜來(lái)防止欠擬合。診斷后的模型需要進(jìn)行進(jìn)一步調(diào)優(yōu),調(diào)優(yōu)后的新模型需要重新診斷,這是一個(gè)反復(fù)迭代不斷逼近的過(guò)程,需要不斷的嘗試,進(jìn)而達(dá)到最優(yōu)的狀態(tài)。

4、模型驗(yàn)證、誤差分析:通過(guò)測(cè)試數(shù)據(jù),驗(yàn)證模型的有效性,觀察誤差樣本,分析誤差產(chǎn)生的原因,往往能使得我們找到提升算法性能的突破點(diǎn)。誤差分析主要是分析出誤差來(lái)源與數(shù)據(jù)、特征、算法。

5、模型融合:提升算法的準(zhǔn)確度主要方法是模型的前端(特征工程、清洗、預(yù)處理、采樣)和后端的模型融合。在機(jī)器學(xué)習(xí)比賽中模型融合非常常見(jiàn),基本都能使得效果有一定的提升。

6、上線運(yùn)行:這一部分內(nèi)容主要跟工程實(shí)現(xiàn)的相關(guān)性比較大。工程上是結(jié)果導(dǎo)向,模型在線上運(yùn)行的效果直接決定模型的成敗。 不單純包括其準(zhǔn)確程度、誤差等情況,還包括其運(yùn)行的速度(時(shí)間復(fù)雜度)、資源消耗程度(空間復(fù)雜度)、穩(wěn)定性是否可接受。

本文到此結(jié)束,希望對(duì)大家有所幫助。


版權(quán)說(shuō)明: 本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!


標(biāo)簽:

最新文章: