《Hadoop技术内幕:深入解析MapReduce架构设计与实现原理》(前三章试读)电子版下载


本博客微信公共账号:hadoop123(微信号为:hadoop-123),分享hadoop技术内幕,hadoop最新技术进展,发布hadoop相关职位和求职信息,hadoop技术交流聚会、讲座以及会议等。二维码如下:


《Hadoop技术内幕:深入解析MapReduce架构设计与实现原理》(前三章试读)电子版下载链接:

(1)百度云盘下载地址

(2)新浪微盘下载地址

如果大家觉得书不错,可到亚马逊、当当、京东、淘宝等网站购买正版书籍。

本书参考资料下载地址:

(1)百度云盘下载地址

(2)新浪微盘下载地址

推荐大家重点关注一下第2章中讲解Hadoop版本特性的相关内容

原创文章,转载请注明: 转载自董的博客

本文链接地址: http://dongxicheng.org/mapreduce-nextgen/hadoop-internals-mapreduce/

作者:Dong,作者介绍:http://dongxicheng.org/about/

本博客的文章集合:

Leave a Comment

发表评论

电子邮件地址不会被公开。 必填项已用*标注

*

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

24 Comments to “《Hadoop技术内幕:深入解析MapReduce架构设计与实现原理》(前三章试读)电子版下载”

膜拜啊,西城,你微博咋不存在了,刚想@下你

[回复]

Dong 回复:

我的微薄是 @西成懂

[回复]

回复:

汗。。现在又有了,刚才确实是显示用户不存在。。

[回复]

回复

你好!我买了本书照着操作,在第8页吧HADOOP的作为新建工程后,HADOOP目录下BIN下命令行命令都不见了,这个为什么会这样呢

[回复]

Dong 回复:

你的eclipse打开了自动编译,打开自动编译后,eclipse在后台编译你的Hadoop源代码,并把编译后的class全部放在bin中,之前bin文件会清除。建议你不要打开eclipse自动编译功能。

[回复]

回复

非常感谢!
能得到图书作者的及时指点,很特别的学习体验。

[回复]

Dong 回复:

客气,以后有问题(最好累积到一定数量,每个问题描述清楚),可以直接给我发邮件:dongxicheng@yahoo.com,我当天就回复。

[回复]

竹叶青 回复:

谢谢!
觉得自己的问题太小,本身没怎么用过ECLIPSE。一般技术作家很不愿意回答没技术含量的问题,都是希望提问者先自行搜索去解决简单问题。觉得类似简单问题您会希望公开贴出来省却重复回答的麻烦,所以直接贴在了这里提问。
参加的一个HADOOP班,教师讲THRIFT时就贴出了您的博客文章地址作为参考文献。非常高兴以后可以向您请教。

[回复]

回复

我看了这个电子版的材料,貌似跟新书一样,花了这么多精力,怎么的也等新书卖一阵再说~~

[回复]

Dong 回复:

呵呵,这是前三章试读。

[回复]

回复

hi,我按着书上的“eclipse调试hadoop源码”进行了环境的搭建,但是出了点小问题
我的环境是cygwin的,用书上”export HADOOP_JOBTRACKER_OPTS … “的脚本,启动hadoop的时候报错了(这可能是因为我的cygwin的环境有些地方与你的不一样),于是我直接在conf目录下的响应的脚本上改了。再启动hadoop的时候成功的看到“Listening for transport dt_socket at address: 8788”这句话,以及包围在它周边的jobtracker,namenode之类的启动日志。之后在cmd中运行“netstat -ano”命令可以看到127.0.0.1:8788是established的状态,以上是hadoop启动的情况。接下来就是在eclipse中按着书上所说的步骤,run->debug configurations搞了一通(指定project,写host:localhost,写port:8788),最后点击”Debug”按钮的时候,会有这样的提示“Failed to connect to remote VM. Connection refused。这个问题已经困扰了我2天了,不知道dong有没有遇到过这样的问题?
Connection refused: connect”。这个问题已经困住我两天了

[回复]

Dong 回复:

这是机器不允许链接,是你的windows配置有问题,这个错误,你在baidu上一找,很多人解答啊。

[回复]

无限飞翔 回复:

您好,我也遇到这样的问题,我是windows7上安装的vmware搭建的hadoop集群,然后eclipse是跑在win7上的,google了,没有解决,请指导

ubuntu上的防火墙什么的都关了,也不知道什么配置问题

[回复]

Leo 回复:

同问,也遇见了这个问题

[回复]

Leo 回复:

是不是断点打错了~~

[回复]

回复

董学长你好:
我已经买了这本书,感觉不错,其中也有一些想法。这里想请教一个问题:第三章51页,那个图3-10,能不能确定机架上的数据量标注是 正确的? 按照你说的启发式算法,我怎么感觉应该是275,250,300和150,而且进一步来讲,如果最后还是要将top N node作为host列表节点的话,对rack进行 排名有什么意义?

[回复]

Dong 回复:

都有优缺点,需要排名筛选block的话,说明一个map task处理的数据在多个节点上,而只能选一个。这时候,通过rack排名,可以尽量避免多部分数据不在一个rack上(跨rack取数据是最慢的,比在同节点和同机架取慢得多得多,这个一定要记住,宁可取一个rack上的,也不要跨rack),而按node排名则无法做到(当然,可能巧了会做到),按rack排名是一种折中方案。

[回复]

回复

董老师:
您好。
我是一名毕业生。想写篇关于Hadoop的海量数据连接和hadoop的多次迭代优化的毕业论文。董老师可不可以推荐几篇中文文献看看呢。。好多东西不理解。。谢谢董老师了。

[回复]

Dong 回复:

毕业生 一个需要重点培养的能力就是查找文献,这个你都问,下次是不是让我给你写论文?

[回复]

Dong 回复:

不好意思,之前回答的有点急躁,这方面,中文文献基本没有,即使中国人写,也是在外文会议或者期刊上发表。我读论文,也基本上只选择外文论文。关于迭代优化的论文,我关注比较少,只关注了迭代方面的系统比如haloop等,我的博客里有介绍。

[回复]

回复

你刺激谁呢。。虚心向你请教,不说拉倒。会点东西了不起了啊,更年期提前还是想直接让我买你书。我去年买了个登山表!

[回复]

Dong 回复:

注意个人素质。

[回复]

J 回复:

你的书大概看了,写的还好吧,主要没别的中文参考,今天转转你的博客看到这个回复,说实话,都是学生来的,这么嘲讽实在没什么意思,毕竟有问题在你这里问不是解决问题的一个途径?要是觉得没必要不回答就是了,hdoop中文论文确实没什么可说,不过有时间嘲讽不回答问题真不知道什么意思。

[回复]

Dong 回复:

O(∩_∩)O~

[回复]

回复