本書是一本系統(tǒng)、全面地介紹Python網絡爬蟲的實戰(zhàn)寶典。作者融合自己豐富的工程實踐經驗,緊密結合演示應用案例,內容覆蓋了幾乎所有網絡爬蟲涉及的核心技術。在內容編排上,一步步地剖析算法背后的概念與原理,提供大量簡潔的代碼實現(xiàn),助你從零基礎開始編程實現(xiàn)深度學習算法。全書按照學習爬蟲所涉及的核心技術從易到難,再到應用的順序分為14章。第1章介紹Python的安裝配置和基礎語法。 第2章介紹爬蟲類型、抓取策略以及網絡基礎知識。第3章介紹Python常用庫。第4章介紹正則表達式的語法、匹配規(guī)則。第5章講解PIL庫、Tesseract庫和TensorFlow庫的語法、類型和識別方法。第6章介紹抓包利器Fiddler。第7章介紹數(shù)據(jù)存儲。第8章介紹Scrapy爬蟲框架。第9章介紹多線程爬蟲。第10章介紹動態(tài)網頁爬蟲。第11章介紹分布式爬蟲。第12章介紹電商網站商品信息爬蟲項目。第13章介紹生活娛樂點評類信息爬蟲。第14章介紹圖片信息類爬蟲項目。