Skip to content

Hadoop

아파치 하둡(Apache Hadoop, High-Availability Distributed Object-Oriented Platform)은 대량의 자료를 처리할 수 있는 큰 컴퓨터 클러스터에서 동작하는 분산 응용 프로그램을 지원하는 프리웨어 자바 소프트웨어 프레임워크이다. 원래 너치의 분산 처리를 지원하기 위해 개발된 것으로, 아파치 루씬의 하부 프로젝트이다. 분산처리 시스템인 구글 파일 시스템을 대체할 수 있는 하둡 분산 파일 시스템(HDFS: Hadoop Distributed File System)과 맵리듀스를 구현한 것이다.

Categories

  • Big data
  • HDFS+MapReduce
  • Apache Flume
  • Oozie
  • Sqoop
  • HCatalog: 하둡 데이터용 테이블 및 스토리지 관리 서비스
  • Pig: 맵리듀스용 프로그래밍 및 데이터 플로우 인터페이스
  • Hive: SQL과 유사한 언어인 하이브QL(HiveQL)을 이용해 하둡 데이터 쿼리를 생성하는 데이터 웨어하우징 솔루션

See also

Favorite site

References


  1. ITWorld_Korea_-big_data-hadoop-_part1.pdf 

  2. ITWorld_Korea_-big_data-hadoop-_part2.pdf 

  3. ITWorld_Korea_-big_data-hadoop-_part3.pdf