Reddit大熱,伯克利PPT帶你入門機器學(xué)習(xí):方法、知識點全面覆蓋
有一份機器學(xué)習(xí)PPT,在Reddit論壇獲得了墻裂歡迎,一日之間攬下400分。
這份PPT來自伯克利CS 189/289課程,從線性代數(shù)復(fù)習(xí),到線性回歸、隨機森林、Boosting……各種方法與其中的知識要點全面覆蓋,簡潔明晰。
在這些詞條里,任選一個往下劃,都會發(fā)現(xiàn)許多寶藏。
比如,下面就是高斯判別分析 (GDA) 。里面講到了生成模型,模型里的假設(shè),以及不同方法之間的對比。
前往課程主頁,就可以把課件與各種配套資料搭配食用;伯克利還把課件的源碼放上了GitHub。
那么,一起來觀賞一下這份入門佳品。
“給你指了條明路”
作為一門友好的基礎(chǔ)課,當(dāng)然要從零開始。
Introduction章節(jié),先介紹了各式各樣的機器學(xué)習(xí)任務(wù):回歸、分類、密度估計、降維……
又介紹了監(jiān)督、半監(jiān)督、無監(jiān)督、強化學(xué)習(xí),這些不同的學(xué)習(xí)方式。
然后,一張美好的地圖在眼前展開,這是用scikit-learn玩轉(zhuǎn)各種任務(wù)的路線圖。
△ 回歸、分類、聚類、降維
從原點出發(fā),按圖索驥,就能到達希望的終點。
比如分類任務(wù)上,可能用到支持向量機?(SVM) 。
這時候,翻一下支持向量機的詞條:
它會告訴你,邏輯回歸解決不了問題,支持向量機或許可以。
原理,用法,以及通常拿來做怎樣的任務(wù),都在這里了。
再比如,決策樹/隨機森林,也是分類方法。
方法背后的理論,用到的split函數(shù),貪心算法等等,這里都會娓娓道來。
如果感覺PPT的介紹太簡約,還可以搭配168頁課程筆記食用。
筆記一共有23章,課件上的每個詞條,幾乎都能找到相應(yīng)的章節(jié)。比如,最后一個詞條Boosting,就對應(yīng)筆記里的第24章。
打開這個章節(jié),任意翻到一頁:
文字詳盡,人類易懂,插圖優(yōu)雅。
從權(quán)重初始化開始,Adaboost的每一步都有介紹。
另外,為什么要用Boosted Tree,也是條分縷析:一是快,二是不用搜索超參數(shù),三是偏差方差權(quán)衡容易做……
這樣一來,剛?cè)肟拥哪悖部梢杂淇斓貙W(xué)習(xí)了。
去吧,皮卡丘
除了PPT和筆記之外,課程主頁上還有作業(yè)和考卷,可以用來檢測你的學(xué)習(xí)成果。
那么,現(xiàn)在就開始學(xué)習(xí)吧。
PPT傳送門:
https://csinva.github.io/pres/189/#/
CS 189/289課程筆記:
https://people.eecs.berkeley.edu/~jrs/papers/machlearn.pdf
CS 189/289課程主頁:
https://people.eecs.berkeley.edu/~jrs/189/
GitHub傳送門:
https://github.com/csinva/csinva.github.io/blob/master/_notes/ref/ml_slides/slides.md
— 完 —
- 馬云正式卸任后,阿里巴巴開盤跌0.87%2019-09-10
- AI獨角獸云知聲,已完成一期科創(chuàng)板IPO輔導(dǎo)2019-10-17
- 亞馬遜在華拓展云計算團隊,挑戰(zhàn)阿里巴巴和騰訊2019-10-16
- IDC:今年上半年中國公有云服務(wù)市場規(guī)模達54.2億美元2019-11-07