懷念起以前讀書時那樣奮鬥的時光嗎?幫你列了十本書,快來看看科技界的大神都推薦什麼書!
假期還可以好好學習,是不是一下子就有動力複習了呢?
必備解暑神器
1. Data Science from Scratch 中文版:用 Python 學資料科學
作者 Jake VanderPlas
這本書介紹了一些核心庫,用 Python 處理數據的時候,就能感受到它們的珍貴。
具體來說,就是 IPython, Numpy, Pandas, Matplotlib, Scikit-Learn,以及相關的軟件包。
啃食此書之前,需熟悉 Python 語言。如需要這門語言的迅速入門之徑,請選用 A Whirlwind Tour of Python(Python 旋風之旅)。而這也不是小白友好的選擇,只是為計算機相關研究人員準備的快速入門。
2. Neural Networks and Deep Learning
作者 Michael Nielsen
這本在線書,分為兩個部分——
·神經網絡,一種唯美的、從萬物生長中汲取靈感的編程範式,讓計算機能夠從數據中學習。
· 深度學習,一系列強有力的技術,讓神經網絡壯大起來。
神經網絡加深度學習,可以給許多問題找到更好的解決方案,在圖像識別、語音識別以及自然語言處理中,皆有用武之地。
此書涵蓋的是,大量的核心概念。
傳送門:
http://neuralnetworksanddeeplearning.com/
3. Think Bayes
作者 Allen B.Downey
這本書講的是,怎樣用計算方法處理貝葉斯統計。
作為 Think X 系列的一員,此書的思路是,如果你會編程,就可以用這項技能來學習其他科目了。
大多數講貝葉斯統計的書,用的都是數學符號,也是以數學概念為脈絡走的。
此書則用 Python 代碼代替數學符號,用離散近似代替連續數學。
於是,數學裡的積分變成了求和,概率分佈的運算大多成了簡單的環。
中文版已出版,資源自尋,以下為英文版地址。
傳送門:
http://greenteapress.com/wp/think-bayes/
4. Machine Learning & Big Data
作者 Kareem Alkaseer
這是一部沒有完成的作品,隨著時間推移內容也慢慢豐盈。
背後的想法是,在理論和實踐之間獲得平衡,讓軟件工程師可以輕鬆使用模型,又不用太依賴庫。
大多數情況下,模型背後的概念或技術都比較簡單直觀,但是細節和術語上就容易出問題。
另外,現有的庫通常都可以解決手邊的問題。但它們大多還是有自己的抽象方法和結構,把基本概念藏在背後了。
這本書的存在,就是想要把那些隱藏的概念釐清。
傳送門:
http://www. kareemalkaseer.com/book s/ml
5. Statistical Learning with Sparsity: The Lasso and Generalizations
作者 Trevor Hastie, Robert Tibshirani, Martin Wainwright
在過去的十年裡,計算和信息技術呈現爆炸式增長。隨之,醫療、生物、金融、時常等等領域都有了大大大量的數據。
這部作品,在一個通用的概念框架之下,描述了一些統計學和數據科學的重要觀點。
傳送門:
https://web.stanford.edu/~hastie/StatLearnSparsity/
6. Statistical inference for data science
作者 Brian Caffo
本書是 Coursera 課程 Statistical Inference ( 推論統計學 ) 的配套書,也是 Data Science 專項課程的一部分。
不過,就算不上課,也可以學這本書。Coursera 課程視頻可以在油管上找到,搭配食用療效更佳。
此書是推論統計學的入門之書,面向的主要是有編程能力的學生,幫他們把這樣的能力用到數據科學或者統計學中。
傳送門:
https://leanpub.com/LittleInferenceBook/read
7. Convex Optimization
作者 Stephen Boyd, Lieven Vandenberghe
凸優化,是一類特殊的數學優化問題,最小二乘法和線性規劃也屬於這個類別。
最小二乘法和線性規劃問題擁有非常完善的理論,可以用編程來輕鬆解決。
而這本書要說的是,凸優化中包含了更寬廣的一類問題,但也依然可以用編程碾壓。
傳送門:
http:// stanford.edu/~boyd/cvxb ook/
8. Natural Language Processing with Python
作者 Steven Bird, Ewan Klein, Edward Loper
這是一本關於自然語言處理(NLP)的書,英語、漢語等人類使用的語言都是系統處理的對象。
與編程語言不同,自然語言在代代相傳的過程中發生演變,很難用明確的規則來解析其中的含義。
不過,人類還是要讓計算機去理解自然語言。這本書,是基於 Python 以及一個名為自然語言工具包(NLTK)的開源庫,寫成的。
9. Automate the Boring Stuff with Python
作者 Al Sweigart
你有沒有花好幾個小時給文件重命名、或者更新表格里的幾百個單元格的經歷?
這麼痛苦的重複工作,還是交給電腦比較好。
跟著這本書,可以學到怎樣用 Python 寫程序來代替你完成那些繁複的操作。
新手友好,無需經驗。
傳送門:
https://automatetheboringstuff.com/
10. Social Media Mining: An Introduction
作者 Reza Zafarani, Mohammad Ali Abbasi, Huan Liu
過去 10 年裡,社交媒體的發展革新了人們互相交流的方式,以及各行各業開展業務的方式。
在社交媒體上,通過互動、分享以及內容消費,每個個體都在以前所未有的速度產生數據。
理解並處理這類新的數據,從而蒐集可用的規律——這給跨學科研究、新算法以及工具的開發,帶來了機遇和挑戰。
此書整合了社交媒體、社交網絡分析以及數據挖掘的相關內容,為學生、數據從業者和研究人員提供一個平台,來初步了解社交媒體挖掘,以及它潛在的可能性。
中文版已出版,資源自尋,以下為英文版地址。
傳送門:
http://dmml.asu.edu/smm/SMM.pdf
獻給即將無法自拔的你。
Reference: https://buzzorange.com/techorange/2018/06/01/machine-learning-book-list/