Hadoop
Hadoop ( 구성요소, 장단점 )
데이터공부방
2020. 10. 21. 11:38
하둡은 4개의 주요 모듈로 구성됩니다.
* Hadoop Common
- 하둡의 다른 모듈을 지원하기 위한 공통 컴포넌트 모듈
* Hadoop HDFS
- 분산저장을 처리하기 위한 모듈
- 여러 개의 서버를 하나의 서버처럼 묶어서 데이터를 저장
* Hadoop YARN
- 병렬처리를 위한 클러스터 자원관리 및 스케줄링 담당
* Hadoop Mapreduce
- 분산되어 저장된 데이터를 병렬 처리할 수 있게 해주는 분산 처리 모듈
* Hadoop Ozone
- 하둡을 위한 오브젝트 저장소
하둡의 장점
- 오픈소스로 라이센스에 대한 비용 부담이 적다
- 시스템을 중단하지 않고, 장비의 추가가 용이하다 (Scale Out)
- 일부 장비에 장애가 발생하더라도 전체 시스템 사용성에 영향이 적다(Fault tolerance)
- 저렴한 구축 비용과 비용대비 빠른 데이터 처리
- 오프라인 배치 프로세싱에 최적화
하둡의 단덤
- HDFS에 저장된 데이터를 변경 불가
- 실시간 데이터 분석 같이 신속하게 처리해야 하는 작업에는 부적합
- 너무 많은 버전과 부실한 서포트
- 설정의 어려움