Hbase 存储和查询维度数据
- Hbase 数据分析效率低 分析函数少,Hbase数据分析涉及磁盘读取数据,比较版本,聚合导致效率低下
ClickHouse 存储和查询宽表数据
- 更擅长数据分析而不是查询明细,维度数据不宜存放 ClickHouse
Hbase 存储和查询维度数据
ClickHouse 存储和查询宽表数据
采集到 Kafka 的 topic_log 和 topic_db 主题的数据即为实时数仓的 ODS 层,这一层的作用是对数据做原样展示和备份。
数仓开发之DIM层
DIM层设计要点:
(1)DIM层的设计依据是维度建模理论,该层存储维度模型的维度表。
(2)DIM层的数据存储在 HBase 表中
DIM 层表是用于维度关联的,要通过主键去获取相关维度信息,这种场景下 K-V 类型数据库的效率较高。
常见的 K-V 类型数据库有 Redis、HBase,而 Redis 的数据常驻内存,会给内存造成较大压力,因而选用 HBase 存储维度数据。
(3)DIM层表名的命名规范为dim_表名