數(shù)據(jù)科學(xué)免費(fèi)電子書(shū)25強(qiáng)大合集:從數(shù)學(xué)基礎(chǔ)到機(jī)器學(xué)習(xí),吳恩達(dá)、Bengio等專(zhuān)家大牛出品
魚(yú)羊 編譯整理
量子位 報(bào)道 | 公眾號(hào) QbitAI
學(xué)習(xí)數(shù)據(jù)科學(xué),到底應(yīng)該看哪些書(shū)?
網(wǎng)絡(luò)上的免費(fèi)資源、書(shū)籍推薦讓人眼花繚亂,東一榔頭西一棒槌,不免讓人心生從入門(mén)到放棄之感。
現(xiàn)在,福利來(lái)了:Medium博主Brenda Hali整理出了一份數(shù)據(jù)科學(xué)最佳免費(fèi)電子書(shū)大合集。
25強(qiáng)選手,從數(shù)學(xué)到Python,再到數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí),應(yīng)有盡有,任君挑選。
數(shù)學(xué)類(lèi)
欲學(xué)人工智能,先要打好數(shù)學(xué)基礎(chǔ)。數(shù)學(xué)類(lèi)六強(qiáng)選手名單如下:
統(tǒng)計(jì)學(xué)習(xí)導(dǎo)論:基于R應(yīng)用
書(shū)名:An Introduction to Statistical Learning
這本書(shū)由南加州大學(xué)馬歇爾商學(xué)院院長(zhǎng)Gareth James等人出品,主要面向非數(shù)學(xué)專(zhuān)業(yè)的高年級(jí)本科生,碩士生和博士生。
該書(shū)內(nèi)容主要由R語(yǔ)言實(shí)現(xiàn),并詳細(xì)說(shuō)明了統(tǒng)計(jì)學(xué)習(xí)方法在現(xiàn)實(shí)生活中的應(yīng)用實(shí)例。
并且,人大統(tǒng)計(jì)學(xué)院王星副教授已將此書(shū)翻譯為中文版。
地址:
http://faculty.marshall.usc.edu/gareth-james/ISL/
統(tǒng)計(jì)思維:程序員數(shù)學(xué)之概率統(tǒng)計(jì)
書(shū)名:Think Stats
這本書(shū)的作者是美國(guó)計(jì)算機(jī)科學(xué)家Allen B. Downey?!督y(tǒng)計(jì)思維》著重介紹了一些簡(jiǎn)單的技術(shù),讀者可以用真實(shí)的數(shù)據(jù)集對(duì)其進(jìn)行探索。
書(shū)中使用美國(guó)國(guó)立衛(wèi)生研究院的數(shù)據(jù)進(jìn)行了案例研究。還有配套的GitHub倉(cāng)庫(kù),提供代碼示例。
地址:
https://bit.ly/2Morui2
GitHub:
https://github.com/AllenDowney/ThinkStats2
統(tǒng)計(jì)學(xué)習(xí)基礎(chǔ)
書(shū)名:The Elements of Statistical Learning: Data Mining, Inference, and Prediction
斯坦福大學(xué)數(shù)學(xué)科學(xué)教授Trevor Hastie等人出品。這本書(shū)強(qiáng)調(diào)的是概念而非數(shù)學(xué)本身,內(nèi)文采用大量圖表來(lái)展示范例。
本書(shū)涵蓋的范圍很廣,從監(jiān)督學(xué)習(xí)到無(wú)監(jiān)督學(xué)習(xí),均有涉及。
地址:
https://web.stanford.edu/~hastie/ElemStatLearn/
簡(jiǎn)明貝葉斯統(tǒng)計(jì)
書(shū)名:Think Bayes: Bayesian Statistics Made Simple
關(guān)于貝葉斯統(tǒng)計(jì)的大多數(shù)書(shū)籍都是用數(shù)學(xué)符號(hào)來(lái)表達(dá)思想。這本書(shū)則用Python代碼代替了數(shù)學(xué)符號(hào),并用離散近似替代連續(xù)。
此書(shū)同樣附贈(zèng)配套代碼實(shí)現(xiàn),還有人提供了IPython notebooks版本,可以在線(xiàn)修改、運(yùn)行代碼。
地址:
IPython notebook:
https://mybinder.org/repo/rlabbe/ThinkBayes
貝葉斯方法:概率編程與貝葉斯推斷
書(shū)名:Probabilistic Programming & Bayesian Methods for Hackers
這本書(shū)旨在從計(jì)算/理解第一,數(shù)學(xué)第二的角度介紹貝葉斯推斷。作為一本入門(mén)書(shū)籍,本門(mén)適合非數(shù)學(xué)專(zhuān)業(yè)、對(duì)數(shù)學(xué)沒(méi)有那么感興趣的貝葉斯方法實(shí)踐者。
地址:
http://camdavidsonpilon.github.io/Probabilistic-Programming-and-Bayesian-Methods-for-Hackers/
計(jì)算機(jī)時(shí)代統(tǒng)計(jì)推斷
書(shū)名:Computer Age Statistical Inference
同樣來(lái)自斯坦福大學(xué),由Bradley Efron和Trevor Hastie兩位老爺子共同打造。從經(jīng)典推理理論開(kāi)篇,以對(duì)統(tǒng)計(jì)和數(shù)據(jù)科學(xué)未來(lái)方向的推測(cè)作為結(jié)尾,這本書(shū)回顧了1950年以來(lái)數(shù)據(jù)分析革命的始末。
生存分析、邏輯回歸、經(jīng)典貝葉斯、隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)、馬爾可夫鏈蒙特卡羅方法……在這本書(shū)中,你都能找到。
地址:
http://web.stanford.edu/~hastie/CASI/
數(shù)據(jù)科學(xué)
介紹完數(shù)學(xué),接下來(lái)正式進(jìn)入數(shù)據(jù)科學(xué)部分。共有六本書(shū)推薦。
The Elements of Data Analytic Style
這本書(shū)側(cè)重于傳統(tǒng)統(tǒng)計(jì)學(xué)課程和教科書(shū)容易遺漏的細(xì)節(jié),可作為數(shù)據(jù)科學(xué)或數(shù)據(jù)分析入門(mén)課程教材。
地址:
https://leanpub.com/datastyle
程序員數(shù)據(jù)挖掘指南
書(shū)名:The Ancient Art of the Numerati
這是一本入門(mén)向書(shū)籍,用于學(xué)習(xí)基本的數(shù)據(jù)挖掘知識(shí)。
大部分關(guān)于數(shù)據(jù)挖掘的書(shū)都著重于理論知識(shí)的講解,雖然理論知識(shí)非常重要,但還是有些讓人望而卻步。如果你是一名程序員,想對(duì)數(shù)據(jù)挖掘做一些初步的了解,那么可以選擇這本書(shū)。
本書(shū)采用“邊學(xué)邊做”的方式編寫(xiě),作者強(qiáng)烈建議讀者動(dòng)手實(shí)踐每一章結(jié)尾提供的練習(xí)題。
地址:
http://guidetodatamining.com/
中文版:
https://github.com/yourtion/DataminingGuideBook
社交媒體挖掘
書(shū)名:Social Media Mining: An Introduction
本書(shū)將社交媒體、社交網(wǎng)絡(luò)分析和數(shù)據(jù)挖掘集成在一起,為相關(guān)從業(yè)人員提供了一個(gè)方便的平臺(tái),以了解社交媒體挖掘的基礎(chǔ)和潛力。
這本書(shū)適合作為高年級(jí)本科生、研究生課程,以及專(zhuān)業(yè)短期課程的教材,內(nèi)含難度系數(shù)不等的練習(xí),可以幫助讀者加強(qiáng)理解。
地址:
http://dmml.asu.edu/smm/book/
數(shù)據(jù)科學(xué)的藝術(shù)
書(shū)名:The Art of Data Science
本書(shū)介紹了分析數(shù)據(jù)的過(guò)程。作者是約翰霍普金斯大學(xué)生物統(tǒng)計(jì)學(xué)教授Roger D. Peng和UT奧斯汀教授Elizabeth Matsui,他們?cè)跀?shù)據(jù)分析方面具有豐富的經(jīng)驗(yàn)。
地址:
http://bedford-computing.co.uk/learning/wp-content/uploads/2016/09/artofdatascience.pdf
數(shù)據(jù)科學(xué)手冊(cè)
書(shū)名:The Data Science Handbook
這本書(shū)是25位杰出數(shù)據(jù)科學(xué)家深度訪(fǎng)談的匯編。其中,有來(lái)自領(lǐng)域?qū)<业囊?jiàn)解、故事和建議。
地址:
https://www.thedatasciencehandbook.com/
數(shù)據(jù)科學(xué)對(duì)話(huà)
書(shū)名:Conversations On Data Science
約翰霍普金斯大學(xué)生物統(tǒng)計(jì)學(xué)教授Roger D. Peng,以及Stitch Fix數(shù)據(jù)科學(xué)家Hilary Parker的對(duì)話(huà)實(shí)錄,主題是數(shù)據(jù)科學(xué)及其在現(xiàn)實(shí)世界中是如何發(fā)揮作用的。
地址:
https://leanpub.com/conversationsondatascience
Python
人生苦短,我用Python。學(xué)習(xí)人工智能,總是繞不開(kāi)Python這一趴。
Python面向?qū)ο缶幊?/h3>
書(shū)名:Object-Oriented Programming with Python
此書(shū)針對(duì)Python 3面向?qū)ο缶幊?,是一本?jiǎn)明、權(quán)威的指南。語(yǔ)言簡(jiǎn)明,概念清晰。適合已經(jīng)對(duì)Python有所理解的中級(jí)學(xué)習(xí)者。
地址:
https://leanpub.com/PythonOOP
Python編程快速上手:讓繁瑣工作自動(dòng)化
書(shū)名:Automate the Boring Stuff with Python
本書(shū)是一本面向?qū)嵺`的Python編程實(shí)用指南。不僅介紹了Python語(yǔ)言的基礎(chǔ)知識(shí),作者還希望通過(guò)項(xiàng)目實(shí)踐,教會(huì)讀者如何應(yīng)用這些知識(shí)和技能。每一章的末尾都有習(xí)題和實(shí)踐項(xiàng)目,附錄部分提供了參考答案。
適合編程基礎(chǔ)薄弱的初學(xué)者。
地址:
https://automatetheboringstuff.com/
中文版:
https://bit.ly/2PUo0Wx
Python數(shù)據(jù)科學(xué)手冊(cè)
書(shū)名:Python Data Science Handbook
Python科學(xué)計(jì)算必備資料。
這本書(shū)非常適合作為解決日常問(wèn)題的參考書(shū)籍,包括:處理、轉(zhuǎn)換和清除數(shù)據(jù);可視化不同類(lèi)型的數(shù)據(jù);使用數(shù)據(jù)建立統(tǒng)計(jì)或機(jī)器學(xué)習(xí)模型。
地址:
http://shop.oreilly.com/product/0636920034919.do
Learn Python, Break Python
這本書(shū)由淺入深,從對(duì)編程的簡(jiǎn)要介紹開(kāi)始,一步步引入更復(fù)雜的程序元素。面向初學(xué)者。
地址:
https://learnpythonbreakpython.com/
Python自然語(yǔ)言處理
書(shū)名:Natural Language Processing with Python
本書(shū)對(duì)自然語(yǔ)言處理進(jìn)行了易于理解的介紹。從中可以學(xué)習(xí)到如何編寫(xiě)適用于大量非結(jié)構(gòu)化文本的Python程序。
地址:
https://www.nltk.org/book/
產(chǎn)品中的數(shù)據(jù)科學(xué)
書(shū)名:Data Science in Production
從初創(chuàng)企業(yè)到價(jià)值數(shù)萬(wàn)億美元的大公司,數(shù)據(jù)科學(xué)正在最大化數(shù)據(jù)價(jià)值方面發(fā)揮著重要的作用。本書(shū)面向希望在多個(gè)云環(huán)境中構(gòu)建數(shù)據(jù)產(chǎn)品,并開(kāi)發(fā)應(yīng)用數(shù)據(jù)科學(xué)技能的分析從業(yè)人員。
地址:
https://leanpub.com/ProductionDataScience
數(shù)據(jù)驅(qū)動(dòng)
書(shū)名:Data Driven
介紹了Google、Linkedln和Facebook如何利用自身數(shù)據(jù),以及沃爾瑪,UPS和其他公司是如何在大數(shù)據(jù)時(shí)代到來(lái)之前,就充分利用了數(shù)據(jù)資源的案例。
地址:
https://www.oreilly.com/library/view/data-driven/9781491925454/
機(jī)器學(xué)習(xí)
接下來(lái),進(jìn)入機(jī)器學(xué)習(xí)書(shū)籍的推薦環(huán)節(jié)。
Scikit?Learn與TensorFlow機(jī)器學(xué)習(xí)實(shí)用指南
書(shū)名:Hands-on Machine Learning with Scikit-Learn and TensorFlow
通過(guò)具體的示例,最少的理論和scikit-learn、TensorFlow這兩大工具,作者將構(gòu)建人工智能系統(tǒng)的概念和工具直觀地展示了出來(lái)。同樣由淺入深循序漸進(jìn),從簡(jiǎn)單的線(xiàn)性回歸開(kāi)始,一路深入到神經(jīng)網(wǎng)絡(luò)。
地址:
https://github.com/ageron/handson-ml
深入理解機(jī)器學(xué)習(xí):從原理到算法
書(shū)名:Understanding Machine Learning: From Theory to Algorithms
本書(shū)討論了學(xué)習(xí)的計(jì)算復(fù)雜度、凸性和穩(wěn)定性、PAC-貝葉斯方法、壓縮界等概念,并介紹了一些重要的算法范式,包括隨機(jī)梯度下降、神經(jīng)元網(wǎng)絡(luò)以及結(jié)構(gòu)化輸出。
適合有一定基礎(chǔ)的高年級(jí)本科生和研究生學(xué)習(xí),也適合作為IT行業(yè)從事數(shù)據(jù)分析和挖掘的專(zhuān)業(yè)人員以及研究人員參考閱讀。
地址:
https://www.cse.huji.ac.il/~shais/UnderstandingMachineLearning/toc.html
強(qiáng)化學(xué)習(xí)簡(jiǎn)介
書(shū)名:Reinforcement Learning: An Introduction
本書(shū)對(duì)強(qiáng)化學(xué)習(xí)領(lǐng)域的關(guān)鍵思想和算法進(jìn)行了簡(jiǎn)明清晰的說(shuō)明。
地址:
http://incompleteideas.net/book/the-book.html
深度學(xué)習(xí)
書(shū)名:Deep Learning
Ian Goodfellow,Yoshua Bengio和Aaron Courville共同撰寫(xiě)。旨在幫助學(xué)生和從業(yè)人員全面了解機(jī)器學(xué)習(xí),尤其是深度學(xué)習(xí)。
地址:
http://www.deeplearningbook.org/
Machine Learning Yearning
吳恩達(dá)出品。本書(shū)的重點(diǎn)不在于機(jī)器學(xué)習(xí)算法本身,而是如何讓機(jī)器學(xué)習(xí)算法工作。
地址:
https://github.com/amusi/machine-learning-yearning-cn
數(shù)據(jù)可視化
D3 Tips and Tricks
最后推薦一本關(guān)于數(shù)據(jù)可視化的書(shū)籍。
D3 Tips and Tricks介紹了如何利用d3.js這一工具,實(shí)現(xiàn)數(shù)據(jù)可視化。其中包含50多個(gè)可以下載的代碼示例。
地址:
https://leanpub.com/D3-Tips-and-Tricks
那么,書(shū)單在手,快點(diǎn)學(xué)起來(lái)吧~
博客鏈接:
https://towardsdatascience.com/the-best-free-data-science-ebooks-b671691e5231
— 完 —
- 馬斯克收購(gòu)OpenAI新計(jì)劃實(shí)錘了:找小扎籌千億美元,果然敵人的敵人就是朋友…2025-08-23
- 標(biāo)準(zhǔn)化3D生成質(zhì)量榜單來(lái)了!首創(chuàng)層次化評(píng)價(jià)體系,告別“誰(shuí)的demo更吸睛”主觀評(píng)估2025-08-16
- 阿里閃電入局Agent Infra!智能體新基建亮相WAIC,“超級(jí)大腦”開(kāi)箱即用2025-07-31
- 世紀(jì)華通謝斐:在“三大平衡”中領(lǐng)跑,實(shí)現(xiàn)游戲行業(yè)更高質(zhì)量的發(fā)展2025-08-01