在某个项目里,有接近20个表参与left join,但每个的数据量都超过6万行。在运行中,发现最耗时的阶段只有1个节点在运行,且产生了大量的临时中间文件。查看执行日志确认所有数据表都别拉成了复制表,最后在1个节点上运行。通过调整gcluster_hash_redistribute_join_optimize参数,强行将主表,虽然数据量也不多,拉成分布表,性能有1倍以上的提升。
国产南大通用GBase数据库使用体验
在某个项目里,有接近20个表参与left join,但每个的数据量都超过6万行。在运行中,发现最耗时的阶段只有1个节点在运行,且产生了大量的临时中间文件。查看执行日志确认所有数据表都别拉成了复制表,最后在1个节点上运行。通过调整gcluster_hash_redistribute_join_optimize参数,强行将主表,虽然数据量也不多,拉成分布表,性能有1倍以上的提升。
ssh 在安全加固场景下需要增加额外参数进行远程访问
普通的GBase 8a数据库表,在计算节点上是通过_nX来区分的,本文介绍分区表带来的新的目录和文件命名规则。
本文介绍,在巨杉SequoiaDB 5上做最简单的增删改查操作的例子。
在巨杉数据库 SequoiaDB 5.0.1执行createCL时,发生报错(shell):1 uncaught exception: -104 Node is not primary。经过排查发现,第2个数据节点的主机名DNS没有配置正确,没有添加第1个数据节点的解析,修正后故障消失。
本文介绍GBase 8a V95版本版本提供的虚拟集群(Virtual Cluster 简称VC),适合的场景。虚拟集群主要是物理资源的隔离,在不同的VC上运行不同或相同的业务。
本文介绍在SequoiaDB 5.0.1 安装时,在创建编目节点组时报错 db.createCataRG("sdbserver1", 11800, "/opt/sequoiadb/database/cata/11800") (shell):1 uncaught exception: -15 Network error。需要将第一个参数改成本地的主机名domain才可以。
在GBase 8a数据库集群的V95版本里,支持虚拟集群来物理隔离计算节点资源,实现多租户。本文介绍该版本实现在虚拟集间创建按镜像表的功能,通过镜像功能是双向的的特性,可以实现实时的平等双活,也可以实现读写分离。
南大通用GBase 8a数据库集群,从V95版本开始,支持多列hash,用于改善数据倾斜问题。理论上其最大数量和列数量相同的2000个,但由于源数据表table_distribution里hash_column列最大长度是4096,实际列数会小于理论值。
本文介绍在GBase 8a数据库集群里,和正则有关的功能和函数,包括like、REGEXP、RLIKE关键字,以及regexp_like、regexp_replace、regexp_instr、regexp_substr等函数。