[Hive] Hive3 주요 특징

Hive

[Hive] Hive3 주요 특징

Sencia 2021. 4. 6. 17:06

ACID 트랜잭션처리

Hive3 쓰기 및 읽기 작업은 트랜잭션 테이블 성능 향상
원자적 작업에는 단순 쓰기 및 삽입, 여러 파티션에 대한 쓰기, 단일 SELECT 문에 여러 삽입이 포함
읽기 작업은 작업 중에 발생하는 변경사항의 영향을 받지 않음.
데이터를 삽입하거나 삭제할 수 있으며 소프트웨어 및 하드웨어 충돌시에도 일관성을 유지. 더 이상 테이블을 버킷화할 필요 없기에 Hive 테이블의 생성 및 유지 관리 간소화

Hive 메타스토어 공유

HMS는 여러 컴퓨팅 엔진 (예 : Impala 및 Spark)의 상호 운용을 지원
HMS는 다양한 엔진과 사용자 데이터 액세스 간의 액세스 단순화

Hive와 Spark 통합

Spark 및 Hive 테이블은 Hive Warehouse Connector 및 Spark Direct Reader를 사용하여 상호 운용되어 ACID 관리형 테이블에 접근.. SparkSQL을 사용하여 Spark에서 직접 외부 테이블에 접근 가능
Hive 외부 테이블을 읽거나 쓰는데 HWC필요없음.
Spark 사용자는 Hive에서 직접 읽거나 쓰기. ORC 또는 Parquet 형식으로 Hive 외부 테이블을 읽을 수 있음. ORC 형식으로 만 Hive 외부 테이블을 쓸 수 있음.

쿼리 수준의 워크로드 관리

쿼리 리소스 사용자, 사용량, Hive가 리소스 요청에 응답하는 속도를구성할수있음
워크로드 관리는 병렬 쿼리 실행,쿼리에 대한 클러스터 공유 및 쿼리 성능 향상

구체화뷰

여러 쿼리에 동일한 중간 롤업 또는 조인된 테이블이 자주 필요하기 때문에 중간 테이블을 미리 계산하고 뷰에 캐싱하여 비용이 많이 들고 반복적인 쿼리 공유 방지

쿼리 결과 캐시

Hive는 유사하거나 동일한 쿼리를 필터링하고 캐시.
Hive는 변경되지 않은 데이터를 다시 계산하지 않음. 반복적인 쿼리를 캐싱하면 수백 또는 수천 명의 BI 도구 및 웹 서비스 사용자가 Hive를 쿼리 할 때 부하를 크게 줄일 수 있음

저작자표시

'Hive' 카테고리의 다른 글

[Hive] LLAP(Live Long And Process)의 특징 (0)	2021.04.16

현재글[Hive] Hive3 주요 특징

Sencia X 데엔

장애, ambari, Dynamic partition pruning, kudu 질의, HIVE, hbase, kudu 백업, Adaptive Query Execution, spark3, kudu disk, cloudera, HDFS, SPARK, kafka, hadoop3, kudu backup, AQE, zkfc, kudu, Hadoop,

Today :
Yesterday :

티스토리툴바