本書能滿足讀者全面學習最新的Hadoop技術及其相關技術(Hive、HBase等)的需求,是一本有系統且極具實踐指導意義的Hadoop工具書和參考書。
本書內容全面,對Hadoop整個技術體系進行了全面的講解,不僅包括HDFS、MapReduce、YARN等核心內容,而且還包括Hive、HBase、Mahout、Pig、ZooKeeper、Avro、Chukwa等與Hadoop技術相關的重要內容。實戰性強,不僅為各個知識點精心設計了大量經典的小案例,而且還包括Yahoo!等多個大公司的企業級案例,可操作系極強。
全書一共19章:第1∼2章首先對Hadoop進行了全方位的介紹,然後說明Hadoop在三大主流作業系統平臺上的安裝與配置方法;第3∼6章分別詳細講解了MapReduce計算模型、MapReduce的工作機制、MapReduce應用程式的開發方法,以及多個精巧的MapReduce應用案例;第7章全面講解了Hadoop的I/O操作;第8章對YARN進行了介紹;第9章對HDFS進行了詳細講解和分析;第10章細緻地講解了Hadoop的管理;第11∼17章對Hadoop大生態系統中的Hive、HBase、Mahout、Pig、ZooKeeper、Avro、Chukwa等技術進行了詳細的講解;第18章講解了Hadoop的各種常用外掛程式,以及Hadoop外掛程式的開發方法;第19章分析了Hadoop在Yahoo!、Facebook…等企業中的應用案例。