Hadoop 2.0(YARN/HDFS)学习资料汇总


本博客微信公共账号:hadoop123(微信号为:hadoop-123),分享hadoop技术内幕,hadoop最新技术进展,发布hadoop相关职位和求职信息,hadoop技术交流聚会、讲座以及会议等。二维码如下:


本文档整理了迄今为止Hadoop 2.0(包括YARN和HDFS2)相关的一些学习资料,包括文档、技术博客、Hadoop书籍等,欢迎大家补充,我将持续更新这个页面。

1. PDF资料

(1)“Apache Hadoop YARN:Moving beyondMapReduce and Batch Processing” ,YARN  leader Arun Murthy写的一本关于YARN的书籍,目前只有前两章试读(还在编写中,预定明年12月份出版),下载地址。

(2)“Hadoop 0.23 MRv2分析”,由百度工程师编写,他的新浪微博:@大数据的wm,邮箱: infcollector@gmail.com,这个文档介绍是国内非常早的介绍YARN的资料,我也是从这份资料开始学习的。

(3)“Architecture of Next Generation Apache Hadoop MapReduceFramework”,这份资料来自Hadoop jira,系统全面的介绍了MRv2/YARN的来源、架构和一些内部实现细节。

(4)“Hadoop Security Analysis”, Hadoop 2.0安全机制介绍文档,来自: https://issues.apache.org/jira/browse/HADOOP-9621

这些资料都给出了微盘下载链接,也欢迎大家关注我的新浪微博:西成懂

2. Hadoop 2.0书籍

《Hadoop技术内幕:深入解析YARN架构设计与实现原理》,该书从基本原理到内部实现,全方位介绍了Hadoop 2.0中资源管理系统YARN。具体介绍可登陆官方宣传网站:http://hadoop123.com/

3. 技术博客

(1)Hortonworks中关于YARN的几篇深入分析文章:

Introducing Apache Hadoop YARN

Apache Hadoop YARN – Background and an Overview

Apache Hadoop YARN – Concepts and Applications

Apache Hadoop YARN – ResourceManager

Apache Hadoop YARN – NodeManager

(2)HDFS2剖析方面相当不错的博客:

http://www.sizeofvoid.net/

(3)我的博客,呵呵,主要专注于YARN以及YARN上的计算框架:

http://dongxicheng.org/recommend/

4. Hadoop jira

Hadoop jira是最好的学习资料,里面有大量的PDF文档、栩栩如生的对话和探讨,建议每天都读Hadoop jira,养成习惯,并参与讨论。

HDFS jira:https://issues.apache.org/jira/browse/HDFS

MapReduce jira: https://issues.apache.org/jira/browse/MAPREDUCE

YARN jira:https://issues.apache.org/jira/browse/YARN

原创文章,转载请注明: 转载自董的博客

本文链接地址: http://dongxicheng.org/mapreduce-nextgen/hadoop-yarn-hdfs-material/

作者:Dong,作者介绍:http://dongxicheng.org/about/

本博客的文章集合:

Leave a Comment

发表评论

电子邮件地址不会被公开。 必填项已用*标注

*

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

2 Comments to “Hadoop 2.0(YARN/HDFS)学习资料汇总”

不错,很全面,学习了

[回复]

回复

我发现有点不知道从何学起的感觉。。。

[回复]

回复