Open su3inni opened 11 months ago
Cloud Hadoop 을 사용하여 HDFS , Block Storage, Object Storage, NAS 를 활용할 수 있다.
사용자는 데이터의 위치 정보만 Name Node를 통해 가져오고 이후 데이터에 접근은 직접 Data Node로 한다.
Block Storage에 HDFS (Hadoop Distributed File System)을 구성한다
Storage 가 기본이고 그 위에 File System 을 구축한다. 이때 Cloud Hadoop 은 Block Storage 를 기본으로하고 그 위에 HDFS 를 설치하는 것이다.
File 은 Block 의 상위 개념이며 File은 폴더에 저장되고 위치에 따른 i-node 메타 데이터가 존재한다.
YARN & HDFS
여기서 YARN resource manager 와 HDFS Name node 는 프로세스이다.
Apache HBase
데이터를 객체로 저장하는 것과 파일로 저장하는 것의 접근 방식 차이
데이터 + 메타 데이터 = 객체
의 의미이며 Q. HBase 도 비정형 데이터에 적합한 스토리지 , Object Storage 도 비정형 데이터에 적합한 스토리지인데 두 스토리지를 사용함에 따른 차이점은 무엇인가
1. Cloud Hadoop
NaverCloud에서 제공하는 Cloud Hadoop은 managed / PaaS 이다.
클라우드 생성을 완전 관리해주며 서비스 관리는 사용자가 직접해야한다.
1-1. Cloud Hadoop 접속 방법
터미널 SSH를 통한 edge node 접속
Web UI 를 통한 edge node 접속
1-2. Cloud Hadoop Node 종류
egde node : 외부 접속 gateway 역할
master node : worker 노드 관리 역할
worker node : 실제 작업하는 노드 ( =computing node )
1-3. Cloud Hadoop Node 구성
각 Node 내에 Client , Master , Slave 타입의 component가 존재한다.
Client , Master, Slave 구조
Edge node , master node, data node에 설치되어있는 client type component 구성은 동일하다.
Master node에는 master type의 component가 많이 설치 되어있는 것을 확인할 수 있으며 Edge Node에 존재하는 master component와 다른 종류가 있음을 확인할 수 있다.
Master node 는 고가용성을 위해 2개 존재하고 worker node 는 상황에 맞춰 증가 가능하다.