Hadoop

Hadoop ( 구성요소, 장단점 )

데이터공부방 2020. 10. 21. 11:38

 

하둡은 4개의 주요 모듈로 구성됩니다.

 

* Hadoop Common

- 하둡의 다른 모듈을 지원하기 위한 공통 컴포넌트 모듈

 

* Hadoop HDFS

- 분산저장을 처리하기 위한 모듈

- 여러 개의 서버를 하나의 서버처럼 묶어서 데이터를 저장

 

* Hadoop YARN

- 병렬처리를 위한 클러스터 자원관리 및 스케줄링 담당

 

* Hadoop Mapreduce

- 분산되어 저장된 데이터를 병렬 처리할 수 있게 해주는 분산 처리 모듈

 

* Hadoop Ozone

- 하둡을 위한 오브젝트 저장소

 

하둡의 장점

- 오픈소스로 라이센스에 대한 비용 부담이 적다

- 시스템을 중단하지 않고, 장비의 추가가 용이하다 (Scale Out)

- 일부 장비에 장애가 발생하더라도 전체 시스템 사용성에 영향이 적다(Fault tolerance)

- 저렴한 구축 비용과 비용대비 빠른 데이터 처리

- 오프라인 배치 프로세싱에 최적화

 

하둡의 단덤

- HDFS에 저장된 데이터를 변경 불가

- 실시간 데이터 분석 같이 신속하게 처리해야 하는 작업에는 부적합

- 너무 많은 버전과 부실한 서포트

- 설정의 어려움