# 하둡이란 무엇인가?
## Hadoop 이 뭘까
- 대용량 데이터 저장/처리 위한 오픈소스
- 엄청난 데이터들을 하나의 비싼 장비가 아닌, 200~500 만원대의 저렴한 컴퓨터들을 여러대 사용해서 처리하는 것
- GFS 의 영향 받음
## 하둡이 내세운 새로운 관점
- 과거에는 크기가 얼마던, 메모리 등으로 **옮겨와서…
# Hadoop 과의 만남
## 갈수록 중요해지는 데이터를 관리하는 기술
- 사람들이 과거보다 많은 데이터들을 빠르게 생산하고 있음
- 여러 대기업들에서 다양한 공개 데이터들을 공유하고 있음
- **데이터는 갈수록 많아지나, 저장하고 분석하는 일은 매우 어려움**
## 많은 양의 데이터를 저장하고 분석하는 방법
- **데이터를 저장하는 속도…