注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術工業(yè)技術建筑科學建筑設計Python數(shù)據(jù)分析入門:從數(shù)據(jù)獲取到可視化

Python數(shù)據(jù)分析入門:從數(shù)據(jù)獲取到可視化

Python數(shù)據(jù)分析入門:從數(shù)據(jù)獲取到可視化

定 價:¥59.00

作 者: 沈祥壯
出版社: 電子工業(yè)出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787121336539 出版時間: 2018-03-01 包裝:
開本: 16開 頁數(shù): 260 字數(shù):  

內容簡介

  本書作為數(shù)據(jù)分析的入門圖書,以Python語言為基礎,介紹了數(shù)據(jù)分析的整個流程。本書內容涵蓋數(shù)據(jù)的獲?。淳W絡爬蟲程序的設計)、前期數(shù)據(jù)的清洗和處理、運用機器學習算法進行建模分析,以及使用可視化的方法展示數(shù)據(jù)及結果。首先,書中不會涉及過于高級的語法,不過還是希望讀者有一定的語法基礎,這樣可以更好地理解本書的內容。其次,本書重點在于應用Python來完成一些數(shù)據(jù)分析和數(shù)據(jù)處理的工作,即如何使用Python來完成工作而非專注于Python語言語法等原理的講解。本書的目的是讓初學者不論對數(shù)據(jù)分析流程本身還是Python語言,都能有一個十分直觀的感受,為以后的深入學習打下基礎。最后,讀者不必須按順序通讀本書,因為各個章節(jié)層次比較分明,可以根據(jù)興趣或者需要來自行安排。例如第5章介紹了一些實戰(zhàn)的小項目,有趣且難度不大,大家可以在學習前面內容之余來閱讀這部分內容。

作者簡介

  沈祥壯 自學Python兩年,以數(shù)據(jù)分析為主線,系統(tǒng)學習了數(shù)據(jù)的采集,處理、分析和可視化。在研究統(tǒng)計機器學習理論的同時,使用Python語言實現(xiàn)了部分統(tǒng)計學習算法。研究方向包括數(shù)據(jù)采集,數(shù)據(jù)挖掘,統(tǒng)計機器學習及圖像處理。

圖書目錄

1  準備 1
1.1  開發(fā)環(huán)境搭建 2
1.1.1  在Ubuntu系統(tǒng)下搭建Python集成開發(fā)環(huán)境 2
1.1.2  在Windows系統(tǒng)下搭建Python集成開發(fā)環(huán)境 13
1.1.3  三種安裝第三方庫的方法 16
1.2  Python基礎語法介紹 19
1.2.1  if__name__=='__main__' 20
1.2.2  列表解析式 22
1.2.3  裝飾器 23
1.2.4  遞歸函數(shù) 26
1.2.5  面向對象 27
1.3  The Zen of Python 28
參考文獻 30
2  數(shù)據(jù)的獲取 31
2.1  爬蟲簡介 31
2.2  數(shù)據(jù)抓取實踐 33
2.2.1  請求網頁數(shù)據(jù) 33
2.2.2  網頁解析 38
2.2.3  數(shù)據(jù)的存儲 46
2.3  爬蟲進階 50
2.3.1  異常處理 50
2.3.2  robots.txt 58
2.3.3  動態(tài)UA 60
2.3.4  代理IP 61
2.3.5  編碼檢測 61
2.3.6  正則表達式入門 63
2.3.7  模擬登錄 69
2.3.8  驗證碼問題 74
2.3.9  動態(tài)加載內容的獲取 84
2.3.10 多線程與多進程 93
2.4  爬蟲總結 101
參考文獻 102
3  數(shù)據(jù)的存取與清洗 103
3.1  數(shù)據(jù)存取 103
3.1.1  基本文件操作 103
3.1.2  CSV文件的存取 111
3.1.3  JSON文件的存取 116
3.1.4  XLSX文件的存取 121
3.1.5  MySQL數(shù)據(jù)庫文件的存取 137
3.2  NumPy 145
3.2.1  NumPy簡介 145
3.2.2  NumPy基本操作 146
3.3  pandas 158
3.3.1  pandas簡介 158
3.3.2  Series與DataFrame的使用 159
3.3.3  布爾值數(shù)組與函數(shù)應用 169
3.4  數(shù)據(jù)的清洗 174
3.4.1  編碼問題 174
3.4.2  缺失值的檢測與處理 175
3.4.3  去除異常值 181
3.4.4  去除重復值與冗余信息 183
3.4.5  注意事項 185
參考文獻 187
4  數(shù)據(jù)的分析及可視化 188
4.1  探索性數(shù)據(jù)分析 189
4.1.1  基本流程 189
4.1.2  數(shù)據(jù)降維 197
4.2  機器學習入門 199
4.2.1  機器學習簡介 200
4.2.2  決策樹――機器學習算法的應用 202
4.3  手動實現(xiàn)KNN算法 205
4.3.1  特例――最鄰近分類器 205
4.3.2  KNN算法的完整實現(xiàn) 213
4.4  數(shù)據(jù)可視化 215
4.4.1  高質量作圖工具――matplotlib 215
4.4.2  快速作圖工具――pandas與matplotlib 223
4.4.3  簡捷作圖工具――seaborn與matplotlib 226
4.4.4  詞云圖 230
參考文獻 232
5  Python與生活 234
5.1  定制一個新聞提醒服務 234
5.1.1  新聞數(shù)據(jù)的抓取 235
5.1.2  實現(xiàn)郵件發(fā)送功能 237
5.1.3  定時執(zhí)行及本地日志記錄 239
5.2  Python與數(shù)學 241
5.2.1  估計π值 242
5.2.2  三門問題 245
5.2.3  解決LP與QP問題(選讀) 247
5.3  QQ群聊天記錄數(shù)據(jù)分析 251
參考文獻 256

本目錄推薦

掃描二維碼
Copyright ? 讀書網 m.shuitoufair.cn 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號