TiDB 最佳实践系列-海量 Region 集群调优

  |   0 评论   |   0 浏览

本文主要参考TIDB在知乎上面的文章(TiDB 最佳实践系列),原文点我,结合前段时间生产环境下出现了由于大量region引起的故障所写的文章。下面是具体内容:


在 TiDB 的架构中,所有的数据按照 range 划分成一个个 Region 分布在多个 TiKV 实例上。随着数据的写入,一个集群中会产生上百万,甚至千万个 Region。而量变引起质变,单 TiKV 实例上过多的 Region 无疑会带来比较大的负担,进而影响整个集群的性能表现。

在10月17号,我们生产环境下的TIDB出现了读写都非常缓慢的故障。经过查看Grafana发现有大量的balance-region的操作,由于该操作导致了Tikv的负载非常高,IO也很忙碌。我们也在TIDB的社区上做了提问,得到的答复是我们的region数量太大了,建议开启合并region的选项。在开启region merge后一段时间,regions数量开始减少,TiKV也逐渐恢复了正常。


标题:TiDB 最佳实践系列-海量 Region 集群调优
作者:pangcm
地址:http://pangcm.club/articles/2019/10/30/1572405789897.html