本書通過大量實例介紹大數(shù)據平臺技術,分4篇。大數(shù)據存儲篇包括第1~3章,內容包括大數(shù)據技術概述、數(shù)據采集和大數(shù)據、大數(shù)據框架的安裝和配置;大數(shù)據管理篇包括第4~7章,內容包括HDFS、Hadoop分布式計算模型、分布式協(xié)調服務ZooKeeper、Hadoop的集群資源管理系統(tǒng)YARN;大數(shù)據分析篇包括第8~10章,內容包括數(shù)據庫MySQL和數(shù)據倉庫Hive、NoSQL數(shù)據庫HBase、基于內存的分布式計算框架Spark;大數(shù)據應用篇包括第11、12章,內容包括數(shù)據可視化、大數(shù)據應用綜合案例。 本書可作為高等學校數(shù)據科學與大數(shù)據技術、計算機科學與技術、人工智能等理工類專業(yè)大數(shù)據平臺技術課程的教材,也可供廣大計算機愛好者及軟件開發(fā)人員參考。