Open rainit2006 opened 7 years ago
原 MapReduce 程序的流程及设计思路:
TaskTracker
是 Map-reduce 集群中每台机器都有的一个部分,他做的事情主要是监视自己所在机器的资源情况。存在的问题:
https://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop-yarn/images/image002.jpg
重构根本的思想是将 JobTracker 两个主要的功能分离成单独的组件,这两个功能是资源管理和任务调度 / 监控。新的资源管理器全局管理所有应用程序计算资源的分配,每一个应用的 ApplicationMaster 负责相应的调度和协调。一个应用程序无非是一个单独的传统的 MapReduce 任务或者是一个 DAG( 有向无环图 ) 任务。ResourceManager 和每一台机器的节点管理服务器能够管理用户在那台机器上的进程并能对计算进行组织。
原框架中核心的 JobTracker 和 TaskTracker 不见了,取而代之的是 ResourceManager, ApplicationMaster 与 NodeManager 三个部分。
Yarn 框架相对于老的 MapReduce 框架什么优势呢?我们可以看到:
Hadoop Architecture Hadoop framework includes following four modules:
Hadoop Yarn 框架 Demo 示例 Demo 场景介绍:Weblogic 应用服务器日志分析 https://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop-yarn/
YARNの仕組み YARNを構成するノード
YARN上のアプリケーション MapReduce以外のアプリケーションをYARN上で動作させるために、様々なプロジェクトが動いています。代表的なプロジェクトとしては、以下のものがあります。