Hive

[Hive] Hive3 주요 특징

Sencia 2021. 4. 6. 17:06
반응형

ACID 트랜잭션처리

  • Hive3 쓰기 및 기 작업랜잭션 테이블 성능
    원자적 작업에는 단
    순 쓰기 및 삽입, 여러 파티션에 기, 단일 SELECT 문에 여러 삽입
  • 기 작업작업 에 발하는 변경사항의 영지 않음.
    데이터를
    삽입하거나 삭제할 수 있으며 소프트웨어 및 하드웨어 충돌시에도 일관성을 유지. 더 이상 테이블을 버화할 필요 없기에 Hive 테이블의 성 및 유지 관리 간소화

 

Hive 메타스토어 공유

  • HMS는 여러 컴퓨팅 엔진 (예 : Impala 및 Spark)의 상호 운용을 지원
    HMS는 다양한
    사용자 데이터 액세스 간의 액세스 단

 

Hive와 Spark 통합

  • Spark 및 Hive 테이블Hive Warehouse Connector 및 Spark Direct Reader를 사용하여 상호 운용되어 ACID 관리테이블에 접근.. SparkSQL을 사용하여 Spark에서 직접 외부 테이블에 접근 가능
  • Hive 부 테이블을 나 쓰는데 HWC필요없음.
    Spark 사용자는 Hive에서
    직접 읽나 쓰기. ORC 는 Parquet 로 Hive 부 테이블을 을 수 음. ORC 로 만 Hive 부 테이블을 음.

 

쿼리 수준의 워크로드 관리

  • 리 리소스 사용자, 사용량, Hive가 리소스 요응답하는 속도를구성할수
  • 워크로드 관리는 병렬 쿼행,리에 한 클러스터 유 및 리 성능

 

구체화뷰

  • 여러 리에 동일한 간 롤업 는 조인테이블이 자주 필요하기 문에 간 테이블을 리 계하고 캐싱하여 비용이 고 반적인 유 방지

 

쿼리 결과 캐시

  • Hive는 유사하거동일한 리를 필터하고 시.
    Hive는 변경되지 않
    데이터를 다시 계하지 않음. 반적인 리를 캐싱수백 는 수천 명의 BI 도구 및 서비스 사용자가 Hive를 리 할 부하를 크게 일 수
반응형

'Hive' 카테고리의 다른 글

[Hive] LLAP(Live Long And Process)의 특징  (0) 2021.04.16