隨著社交網絡、網絡分析和智能型電子商務的興起,傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)顯然已無法滿足海量數(shù)據(jù)的管理需求。 作為一種新的處理模式,大數(shù)據(jù)系統(tǒng)應運而生,它使用多臺機器并行工作,能夠對海量數(shù)據(jù)進行存儲、處理、分析,進而幫助用戶從中提取對優(yōu)化流程、實現(xiàn)高增長率的有用信息,做更為精準有效的決策。 但不可忽略的是,它也引入了大多數(shù)開發(fā)者并不熟悉的、困擾傳統(tǒng)架構的復雜性問題。本書將教你充分利用集群硬件優(yōu)勢的Lambda架構,以及專門用來捕獲和分析網絡規(guī)模數(shù)據(jù)的新工具,來創(chuàng)建這些系統(tǒng)。它將描述一個可擴展的、易于理解大數(shù)據(jù)系統(tǒng)的方法——可以由小團隊構建并運行。本書共18章,除了介紹基本概念,其他章節(jié)采用“理論+示例”的方式來闡釋相關概念,并使用現(xiàn)實世界中的工具加以論證。其中,第1章介紹了數(shù)據(jù)系統(tǒng)的原理,給出了Lambda架構的概述,并概述了構建任何數(shù)據(jù)系統(tǒng)的廣義方法。第2~9章集中闡述Lambda架構的批處理層。第10章和第11章集中闡述服務層,讓讀者了解只批量寫入的特定數(shù)據(jù)庫——這些數(shù)據(jù)庫比傳統(tǒng)數(shù)據(jù)庫更簡單,它們具有出色的性能,并具備可操作性、穩(wěn)健性等特點。第12~17章集中闡述速度層,讓讀者更明確地了解NoSQL數(shù)據(jù)庫、流處理和管理增量計算的復雜性。 第18章通過綜合回顧Lambda架構的相關知識,幫助讀者了解增量批處理、基本Lambda架構的變種,以及如何充分利用資源。