在YARN中,一个ApplicationMaster需要占用一个container,该container可能位于任意一个NodeManager上,这给ApplicationMaster测试带来很大麻烦,为了解决该问题,YARN引入了一种新的ApplicationMaster—Unmanaged AM,这种AM运行在客户端,不再由ResourceManager启动和销毁。本文介绍了Unmanaged AM工作原理。

推测执行优化机制采用了典型的以空间换时间的优化策略,它同时启动多个相同task(备份任务)处理相同的数据块,哪个完成的早,则采用哪个task的结果,本文介绍了MapReduce 2.0中的实现。