반응형
Write
단일 tablet으로 wirte 발송
블룸 필터 검사(bloom filter checking)를 통해 kudu는 디스크에서 일부 검색을 피할 수 있습니다.
PK를 사용하면 주어진 키에 대한 확실한 검색이 가능합니다.
- inserts: key 존재하지 않음
- updates/deletes: key 존재
- upsert: key가 존재할수도 존재하지 않을 수도 있음
Read
연관없는 tablets들은 넘기고 연관있는 각 tablet을 PK 이용하여 데이터를 읽는다.
데이터를 통해 반복하는 동안 deltas를 읽는다.
Partitioning
- 일반적인 쿼리의 경우 "pruing"를 활성화하여 전체 태블릿을 건너 뛰고 I / O를 줄입니다.
- write 작업을 많은 partition으로 분산화
- 각 tablet의 replica 크기를 작게 유지
1) Range partitioning
특정 칼럼의 범위를 중심으로 파티셔닝
특정 칼럼 기준으로 데이터를 삭제할때 단건으로 삭제하는 것보다 파티션 drop 성능이 훨씬 좋다.
2) Hash partitioning
hash값에 따라 partition을 정하는 기법으로 전체 tablet server에 고르게 분포시키기 좋다.
3) Range + Hash partitioning
두 가지 파티셔닝의 장점을 취한 방법으로 모든 범위에 대해 안정적
참고
1) 2019년 클라우데라 웨비나 세션 중 "Apache kudu를 이용한 실시간 워크로드 최적화"
후속편
반응형
'Kudu' 카테고리의 다른 글
[Kudu] Apache Ranger로 권한 제어 (0) | 2021.04.13 |
---|---|
[kudu] 3편 - Scaling cluster (0) | 2021.04.06 |
[kudu] 2편 - Schema, Compaction, Disk, Memory (0) | 2021.04.06 |
[기초] Kudu 기본 개념 (0) | 2021.03.30 |
[사례] kudu X 카카오뱅크 (0) | 2021.03.29 |