大數據技術架構：核心原理與應用實踐

定　價：￥89.00

作　者：	李智慧著
出版社：	電子工業(yè)出版社
叢編項：
標　簽：	暫缺

購買這本書可以去

ISBN：	9787121414183	出版時間：	2021-07-01	包裝：	平裝
開本：	16開	頁數：	208	字數：

內容簡介

　　在人工智能時代，不論是否從事大數據開發(fā)，掌握大數據的原理和架構早已成為每個工程師的必備技能。本書結合作者多年大數據開發(fā)、應用的經驗，深入淺出地闡述大數據的完整知識體系，幫助讀者從不同視角找到大數據方向的突破口，真正從普通開發(fā)者晉升為擁有大數據思維并能解決復雜問題的技術專家。本書一共分為7章，分別是大數據的前世今生與應用場景、Hadoop大數據原理與架構、大數據生態(tài)體系主要產品原理與架構、大數據開發(fā)實踐、大數據平臺與系統(tǒng)集成、大數據分析與運營、大數據算法與機器學習。本書既可作為初學者了解大數據技術的入門指南，也可作為有一定經驗的工程師深入理解大數據思維的有益參考。

作者簡介

　　李智慧，同程旅行交通首席架構師。曾任阿里巴巴、Intel架構師，長期從事分布式系統(tǒng)與大數據開發(fā)，Apache Spark 代碼貢獻者，騰訊云 TVP，著有暢銷書《大型網站技術架構：核心原理與案例分析》。

圖書目錄

1 大數據的前世今生與應用場景\t1
大數據的前世今生：大數據簡史與大數據生態(tài)體系概述\t1
從搜索引擎到人工智能：大數據應用發(fā)展史\t6
大數據應用的搜索引擎時代\t6
大數據應用的數據倉庫時代\t7
大數據應用的數據挖掘時代\t7
大數據應用的機器學習時代\t8
數據驅動一切：大數據全領域應用場景分析\t10
大數據在醫(yī)療健康領域的應用\t10
大數據在社交媒體領域的應用\t12
大數據在金融領域的應用\t13
大數據在新零售領域的應用\t13
大數據在交通領域的應用\t13
2 Hadoop大數據原理與架構\t15
移動計算比移動數據更劃算\t16
從RAID看垂直伸縮到水平伸縮的演化\t19
新技術層出不窮，HDFS依然是存儲的王者\t23
為什么說MapReduce既是編程模型又是計算框架\t29
MapReduce如何讓數據完成一次旅行\(zhòng)t33
MapReduce作業(yè)啟動和運行機制\t34
MapReduce數據合并與連接機制\t37
為什么把Yarn稱為資源調度框架\t39
程序員應該如何學好大數據技術\t44
3 大數據生態(tài)體系主要產品原理與架構\t47
Hive是如何讓MapReduce實現SQL操作的\t47
用MapReduce實現SQL數據分析的原理\t48
Hive的架構\t49
Hive如何實現join操作\t51
人們并沒有覺得MapReduce速度慢，直到Spark出現\t53
同樣的本質，為何Spark可以更高效\t57
Spark的計算階段\t57
Spark的作業(yè)管理\t61
Spark的執(zhí)行過程\t62
BigTable的開源實現：HBase\t63
HBase可伸縮架構\t64
HBase可擴展數據模型\t65
HBase的高性能存儲\t66
流式計算的代表：Storm、Spark Streaming、Flink\t68
Storm\t68
Spark Streaming\t70
Flink\t71
ZooKeeper是如何保證數據一致性的\t74
分布式一致性原理\t75
Paxos算法與ZooKeeper架構\t76
大數據技術應用場景分析\t80
4 大數據開發(fā)實踐\t82
如何自己開發(fā)一個大數據SQL引擎\t83
Panthera架構\t83
Panthera的SQL語法轉換\t84
比如這條SQL\t85
Panthera程序設計\t85
Spark的性能優(yōu)化案例分析\t89
Apache開源社區(qū)的組織和參與方式\t90
軟件性能優(yōu)化\t91
大數據開發(fā)的性能優(yōu)化\t91
Spark性能優(yōu)化\t92
案例1：Spark任務文件初始化調優(yōu)\t95
案例2：Spark任務調度優(yōu)化\t98
案例3：Spark應用配置優(yōu)化\t102
案例4：操作系統(tǒng)配置優(yōu)化\t102
案例5：硬件優(yōu)化\t103
大數據基準測試可以帶來什么好處\t105
大數據基準測試的應用\t105
大數據基準測試工具HiBench\t107
從大數據性能測試工具Dew看如何快速開發(fā)大數據系統(tǒng)\t109
Dew設計與開發(fā)\t110
Akka的原理與應用\t112
大數據開發(fā)實踐的啟示\t115
5 大數據平臺與系統(tǒng)集成\t117
大數據平臺 = 互聯網產品 + 大數據產品\t117
數據采集\t119
數據處理\t119
數據輸出與展示\t119
大數據任務調度\t120
大數據平臺Lamda架構\t120
數據在大數據平臺中的流轉\t121
大數據從哪里來\t123
從數據庫導入\t123
從日志文件導入\t124
前端埋點采集\t126
爬蟲系統(tǒng)\t128
數據的熵\t128
知名大廠如何搭建大數據平臺\t129
淘寶大數據平臺\t129
美團大數據平臺\t130
滴滴大數據平臺\t131
學架構就是學架構模式\t133
盤點可供中小企業(yè)參考的商業(yè)大數據平臺\t134
大數據解決方案提供商\t134
大數據云計算服務商\t136
大數據SaaS服務商\t138
大數據開放平臺\t138
當大數據遇上物聯網\t139
物聯網應用場景分析\t139
物聯網平臺架構\t140
大數據技術在物聯網中的應用\t141
6 大數據分析與運營\t144
老板想要監(jiān)控什么運營指標\t144
互聯網運營的常用數據指標\t145
數據可視化圖表與數據監(jiān)控\t147
一個用戶新增下降的數據分析案例\t150
數據分析案例\t151
數據分析方法\t154
AB測試與灰度發(fā)布必知必會\t156
A/B測試的過程\t157
A/B測試的系統(tǒng)架構\t158
灰度發(fā)布\t159
如何利用大數據成為“增長黑客”\t160
Hotmail的增長黑客故事\t161
AARRR用戶增長模型\t161
利用大數據增長用戶數量\t163
為什么說數據驅動運營\t164
7 大數據算法與機器學習\t168
如何對數據進行分類和預測\t168
k近鄰分類算法\t169
數據的距離\t170
文本的特征值\t171
貝葉斯分類\t172
如何發(fā)掘數據的關系\t174
搜索排序\t174
關聯分析\t177
聚類\t179
如何預測用戶的喜好\t181
基于人口統(tǒng)計的推薦\t182
基于商品屬性的推薦\t183
基于用戶的協(xié)同過濾推薦\t184
基于商品的協(xié)同過濾推薦\t185
機器學習的數學原理是什么\t186
樣本\t187
模型\t187
算法\t188
為什么學機器學習要學數學\t189
從感知機到神經網絡\t190
感知機\t191
神經網絡\t192