ClickHouse 数据存储
概述
ClickHouse 动作用于将规则引擎处理后的数据存储到 ClickHouse 数据库中。ClickHouse 是一个高性能的列式数据库,特别适合大数据分析和 OLAP 查询场景。
配置参数
基础配置
参数 | 类型 | 必填 | 默认值 | 说明 |
---|---|---|---|---|
dataSource | string | 是 | - | ClickHouse 数据源名称 |
table | string | 是 | - | 目标表名 |
fields | array | 是 | - | 字段映射配置 |
batchSize | number | 否 | 1000 | 批量插入大小 |
batchInterval | number | 否 | 1000 | 批量间隔(毫秒) |
timeout | number | 否 | 30000 | 操作超时时间(毫秒) |
字段映射配置
{
"fields": [
{
"name": "device_id",
"type": "String",
"value": "clientId"
},
{
"name": "timestamp",
"type": "DateTime",
"value": "timestamp"
},
{
"name": "value",
"type": "Float64",
"value": "payload.value"
}
]
}
使用示例
基础配置示例
{
"action": "SAVE_CLICKHOUSE",
"config": {
"dataSource": "clickhouse_ds",
"table": "device_metrics",
"fields": [
{
"name": "device_id",
"type": "String",
"value": "clientId"
},
{
"name": "timestamp",
"type": "DateTime",
"value": "timestamp"
},
{
"name": "temperature",
"type": "Float64",
"value": "payload.temperature"
},
{
"name": "humidity",
"type": "Float64",
"value": "payload.humidity"
}
],
"batchSize": 1000,
"batchInterval": 1000
}
}
规则示例
-- 收集传感器数据并存储到 ClickHouse
SELECT
clientId,
timestamp,
payload.temperature as temperature,
payload.humidity as humidity,
payload.pressure as pressure
FROM "$EVENT.PUBLISH"
WHERE topic =~ 'sensor/+/data'
AND isJson(payload)
性能优化
批量处理优化
- 批量大小设置:根据数据量调整
batchSize
,建议 1000-10000 - 批量间隔设置:根据实时性要求调整
batchInterval
- 并发控制:合理设置并发数避免 ClickHouse 压力过大
表结构优化
- 分区策略:使用合适的分区键(如日期)
- 排序键:设置合适的排序键提高查询性能
- 索引优化:为常用查询字段创建索引
错误处理
常见错误
- 连接错误:检查 ClickHouse 服务状态和网络连接
- 表不存在