本文将从用户伪装(impersonate,翻译成“模仿”也许更好些)角度介绍Hadoop安全机制,用户伪装机制使得Hadoop支持类似于linux “sudo”的功能,即用户A以用户B的身份执行功能。该机制属于Hadoop安全机制的一部分,因此适用于Hadoop 1.0之后的版本。

大家都知道hadoop 1.0中存在的问题,比如HDFS中NameNode单点故障,NameNode内存受限制约集群扩展性,MapReduce中的JobTracker单点故障,无法支持多种计算框架等,而在最新发布的hadoop 2.0稳定版hadoop 2.2.0中,这些问题都貌似得到了完美的解决,那么,我们是否可认为hadoop 2.0是一个非常完美的系统,不再存在任何问题了呢?本文尝试回答这个问题。

Hadoop 2.0内核由三个分支组成,分别是HDFS、MapReduce和YARN,而Hadoop生态系统中的其他系统,比如HBase、Hive、Pig等,均是基于这三个系统开发的。截止本文发布,Hadoop 2.0的这三个子系统的单点故障均已经解决或者正在解决(Hadoop HA),本文将为大家介绍当前的进度和具体的解决方案。