192 1681 1-电脑死机

hadoop是什么
2023年4月4日发(作者:紫光输入法5 0)

Hadoop权威指南(中⽂第2版)PDF

基本信息

原书名::TheDefinitiveGuide,SecondEditon

原出版社:O'ReillyMedia

作者:(美)TomWhite[作译者介绍]

译者:周敏奇钱卫宁⾦澈清王晓玲

丛书名:清华⼤学出版社O'Reilly系列

出版社:清华⼤学出版社

ISBN:9787302257585

上架时间:2011-7-4

出版⽇期:2011年7⽉

开本:16开

页码:600

版次:2-1

内容介绍:

《Hadoop权威指南(第2版)》从Hadoop的缘起开始,由浅⼊深,结合理论和实践,全⽅位地介绍Hadoop这⼀⾼性能处理海量数据集

的理想⼯具。全书共16章,3个附录,涉及的主题包括:haddoop简介;mapreduce简介;Hadoop分布式⽂件系统;Hadoop的i/o、

mapreduce应⽤程序开发;mapreduce的⼯作机制;mapreduce的类型和格式;mapreduce的特性;如何构建Hadoop集群,如何管理

Hadoop;pig简介;hbase简介;hive简介;zookeeper简介;开源⼯具sqoop,最后还提供了丰富的案例分析。

《Hadoop权威指南(第2版)》是Hadoop权威参考,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装与运⾏

Hadoop集群。

google帝国的基⽯是什么?mapreduce算法!开源项⽬Hadoop作为它的⼀个具体实现,可以轻松⽤于构建和维护⼀个可靠性⾼、伸缩

性强的分布式系统。

作者tomwhite作为Hadoop的项⽬负责⼈,通过⾃⼰对Hadoop和Hadoop社区的理解,化繁为简,⽤浅显易懂的语⾔介绍了Hadoop

能做什么,怎么做才能充分发挥Hadoop的优势,Hadoop能够和哪些开源⼯具结合使⽤。这是⼀本主题丰富、讲解透彻的权威参考书,可

帮助程序员了解分析海量数据集的细枝末节,帮助管理员掌握搭建和运⾏Hadoop集群的具体过程。

经过修订和更新的第2版概述了Hadoop的最新动态,例如hive、sqoop和avro等。书中还提供了案例分析来帮助读者了解如何⽤

Hadoop来解决具体的问题。如果想充分利⽤数据,从中挖掘出有价值的见解或者观点,毫⽆疑问,这本书将是您不可或缺的重要参考。

使⽤Hadoop分布式⽂件系统(hdfs)来存储⼤型数据集,然后⽤mapreduce对这些数据集执⾏分布式计算

Hadoop的数据和i/o构建块(⽤⼦压缩、数据完整性、序列化和持久处理)

探究mapreducc应⽤开发中常见的陷阱和⾼级特性

设计,构建和管理门adoop专⽤集群或在云上运⾏Hadoop

使⽤pig这种⾼级的查询语⾔来进⾏⼤规模数据处理

使⽤hive(Hadoop的数据仓库系统)来分析数据集

使⽤hbase(Hadoop的数据库)来处理结构化数据和半结构化数据

深⼊介绍zookeeper,⼀个⽤⼦构建分布式系统的协作类型⼯具箱

Hadoop权威指南(中⽂第2版)PDF版下载

⽤户名与密码都是

具体下载⽬录在/2012年资料/7⽉/21⽇/Hadoop权威指南(中⽂第2版)PDF/

更多推荐

hadoop是什么