Skip to content

ClickHouse

오픈소스 컬럼기반 OLAP DB

Features

  • Analytics용 RDBMS
  • 거의 실시간 수준의 빠른 속도, 스케일러블, 안정적
    • 기존 컬럼DB(Vertica,Greenplum) 대비 5x~24x 빠름
    • Hive나 MySQL 대비 100x~1000x 빠름
  • 손쉬운 셋업
  • 풍부한 기능 : 분산/병렬 쿼리 실행, 실시간 쿼리 처리, 데이터 압축, Hot/Cold 저장소 분리, JSON문서 Query, 분산 Join, S3 호환 객체 저장..
  • Fault-tolerant : 멀티-마스터 비동기 복제
  • Highly Reliable : SPOF 없는 분산 시스템
  • 하드웨어를 최대한 활용 : SIMD CPU 명령 최대한 활용,드라이브 접근/데이터 전송 최소화 등

2025년을 위한 7개의 데이터베이스 중 하나

  • Database#2025년을 위한 7개의 데이터베이스 (GeekNews) 참조
  • ClickHouse는 OLAP 작업에 특화된 데이터베이스
    • OLTP는 PostgreSQL, OLAP는 ClickHouse라는 조합이 이상적임
    • 대규모 분석 워크로드를 처리하며, 수평 확장과 샤딩을 통해 높은 데이터 삽입 속도를 지원함
  • ClickHouse의 주요 특징
    • 계층형 스토리지 지원:
      • "핫 데이터"와 "콜드 데이터"를 분리해 저장 가능
      • 예: GitLab 문서에서 이를 활용한 사례를 자세히 다룸
    • 대규모 데이터셋 처리 및 실시간 분석:
      • DuckDB로는 처리하기 어려운 크기의 데이터셋에 적합
      • 실시간 분석이 필요한 상황에서 강력한 성능 제공
  • 운영의 편리함
    • 배포, 확장, 백업 등 운영 관련 문서가 체계적이며 상세함
    • 예: 적절한 CPU 설정 방법까지 다룬 문서 제공
  • ClickHouse 학습 권장
    • 대규모 분석 데이터셋 실험 또는 DuckDB로 작업한 분석을 ClickHouse로 변환
    • ClickHouse의 임베디드 버전인 chDB를 활용해 SQLite와 더 직접적으로 비교 가능

See also

Favorite site