GBase 8a做count distinct时数据切分算法参数_gbase_optimizer_aggr_distinct

GBase 8a数据库,针对count distinct ,sum disticnt等聚合 distinct场景,通过本参数_gbase_optimizer_aggr_distinct指定数据的切分方法。

参数

_gbase_optimizer_aggr_distinct

说明

0:不使用优化
1:自动适配优化,默认值
2:强制使用分组优化,适合唯一值比例多场景
3:强制使用切分优化,适合重复值比例多场景

样例

该参数只影响计算节点本地,无法从集群执行计划看到差别。但可以从trc执行日志里看到是Round-Robin的切分算法,还是Hash的分组方法。

默认的自动优化是通过采样的方式,有几率出现结果不准确的情况,比如1个列,在DC内基本都不一样,但多个DC有大量重复值。反之依然,DC内大量重复值,但多个DC基本不同。

可以通过人工指定的切分算法。