首页 / 数据库 / MySQL / MySQL转换分区表&索引重用
背景:生产环境下,大表数据量剧增,影响到了SQL的执行效率;业务越来越多,陆陆续续增加的索引并不是很合理,为了提高索引的使用率,需要把不必要的索引合并起来,减少索引的数量,提高索引的使用率 方法:大表水平切分-->分区表转换;综合利用联合索引的特点,去掉一些多余的单列索引和一些重复的联合索引 这篇博文的主要内容:
转换分区表的方法:直接alter即可(http://www.linuxidc.com/Linux/2015-08/121268.htm;
分区表效率上的提升:一直以来好奇提升程度有多少这次顺便验证一下(*/ω\*);
索引合并的策略;-------------------------------------正文-------------------------------------分区表效率上的提升,依然采用了sysbench-0.5来进行测试,
虚拟机:
CPU:Intel(R) Xeon(R) CPU E5-2630 v3 @ 2.40GHz,逻辑核心8个内存:32GB硬盘:250G采用五张表,每张表2000W数据,做两组对比:单表 vs 分区表(十个分区,每个分区200W数据)
测试脚本需要注意的地方:跨分区的查询较少,大部分都是在一个分区内;读写混合,包含order by,count(*)等操作;所有查询均用到索引;
测试时间两个小时,结果如下:
总体延时对比(ms) QPS对比 虽说基准测试的结果倾向于理想状况,不过在中高负载下,响应时间降低了超过30%还是挺吓人的Σ( ° △ °|||)︴)
不过这也证明了,DB最大的瓶颈还是在IO~(顺序读最佳) 索引合并的策略:
这里简单写写~
MySQL本身有二级索引和merge_index的特性,这些留在以后再详细写(有生之年系列+1)
生产环境的索引如图(为了效果就不打码了,领导看到了不要打我~_(:з」∠)_) 箭头所指就是这次修改索引的目标,可以看到这三个索引分别是idx1<shop_id>, idx2<shop_id,pay_time>, idx3<order_status,shop_id,pay_time>
MySQL的索引利用有如下几个特点:一张表只能用上一个索引(或者是merge_index);如果where条件中包含联合索引的前置列,那么联合索引也能利用起来 比如说:有idx2存在的情况下,如果where条件只有shop_id,idx2也会被MySQL使用,同样的,where条件包含了shop_id,pay_time,还有其他列的(比如使用idx3的情况),也能用这个联合索引,
如果where条件中没有shop_id这个前置列的话,这个联合索引就不能被利用了~注意:where条件只有shop_id的情况,使用idx2可能会比idx1要有更多的开销(联合索引体积更大),所以要权衡好“精简索引”和“列使用频率”孰轻孰重,做出正确的选择(当然绝大多数时候这种开销是可以忽略不计的)。------------------------------------------------------------------------------------------------------------分区表相关的其他操作---------------------------------------------------------------------------------------------------------------
分区表的管理操作删除分区:alter table emp drop partition p1;不可以删除hash或者key分区。一次性删除多个分区,alter table emp drop partition p1,p2;增加分区:alter table emp add partition (partition p3 values less than (4000));alter table empl add partition (partition p3 values in (40));分解分区:Reorganizepartition关键字可以对表的部分分区或全部分区进行修改,并且不会丢失数据。分解前后分区的整体范围应该一致。alter table tereorganize partition p1 into(partition p1 values less than (100),partition p3 values less than (1000)); ----不会丢失数据合并分区:Merge分区:把2个分区合并为一个。
alter table tereorganize partition p1,p3 into(partition p1 values less than (1000));----不会丢失数据重新定义hash分区表:Alter table emp partition by hash(salary)partitions 7;----不会丢失数据重新定义range分区表:Alter table emp partitionbyrange(salary)(partition p1 values less than (2000),partition p2 values less than (4000)); ----不会丢失数据删除表的所有分区:Alter table emp removepartitioning;--不会丢失数据重建分区:这和先删除保存在分区中的所有记录,然后重新插入它们,具有同样的效果。它可用于整理分区碎片。ALTER TABLE emp rebuild partitionp1,p2;优化分区:如果从分区中删除了大量的行,或者对一个带有可变长度的行(也就是说,有VARCHAR,BLOB,或TEXT类型的列)作了许多修改,可以使用“ALTER TABLE ... OPTIMIZE PARTITION”来收回没有使用的空间,并整理分区数据文件的碎片。ALTER TABLE emp optimize partition p1,p2;分析分区:读取并保存分区的键分布。ALTER TABLE emp analyze partition p1,p2;修补分区:修补被破坏的分区。ALTER TABLE emp repairpartition p1,p2;检查分区:可以使用几乎与对非分区表使用CHECK TABLE 相同的方式检查分区。ALTER TABLE emp CHECK partition p1,p2;这个命令可以告诉你表emp的分区p1,p2中的数据或索引是否已经被破坏。如果发生了这种情况,使用“ALTER TABLE ... REPAIR PARTITION”来修补该分区。本文永久更新链接地址