Open zerocool530 opened 5 years ago
여러개의 MapReduce job을 서로 연결해 사용하면서, 각각의 Hadoop Job 에 대한 시작과 종결, 그 사이의 각종 분기조건 등을 지정해 자동화하거나 스케줄링 하도록 도와주는 서비스가 필요하여 등장하게 됨
Java 기반의 Web Application Workflow Manage System (?) Workflow, Scheduler, Bundle 3가지의 Component 가 존재함
Oozie는 Workflow를 방향성 비순환 그래프(DAG: Direct Acyclic Graph) 규칙에 의거해 규정 및 관리하고 있다.
Workflow 는 Control Node, Action Node 를 가지고 있다.
Workflow a sequence of jobs that will be put together n the right order that will be managed as a DAG cycle - Directed Acyclic Graph
Control Node
Action Node
scheduler is where I will be defining a particular workflow to get triggered on a regular interval
bundle all the related workflows and coordinators will be put together
Apache Hive - Manage, Setup HA, Beeline, WebHCat, HCatalog, Warehouse dir config Hive 는 HDFS를 질의문 형식으로 조작 한다.
Sentry - Install, Configure , Role based authentication, LDAP Integration 룰 기반의 인증 시스템
진행
발표자