hash分区的目的是将数据按照某列进行hash计算后更加均匀的分散到各个分区,相比,range和list分区来说,hash分区不需要明确指定一个给定的列值或者列值集合
应该在保存在哪个分区,mysql会自动按照hash计算后完成这些工作,我们只需要基于将要进行hash的列值指定一个列或者表达式,以及可选的指定要分区的表总的分区数量。
下面我们举一个例子来说,hash分区如何创建。首先我们创建如下的表格:hash_partition_tbl,并插入几条记录到表中,如下所示:
我们也同时看一下,对应的表空间文件是如何分布的(注意,我们已经设置了innodb_file_per_table=1,即每个表单独一个ibd文件),我们在对应的datadir目录下可以看到:
由于我们是分成4个hash区,因此可以看到四个表空间文件,分别是hash_partition_tab#p#pi.ibd,i=0,1,2,3。
这里的hash分区的确定按照如下规则:
mod(YEAR(‘2012-05-01’),4) = mod (2012,4) = 0, 在分区p0;
mod(YEAR(‘2016-05-01’),4) = mod (2016,4) = 0, 在分区p0;
mod(YEAR(‘2010-05-01’),4) = mod (2010,4) = 2, 在分区p2;
mod(YEAR(‘2011-05-01’),4) = mod (2011,4) = 3, 在分区p3;
因此,我们认为 p0有2个记录,p2和p3分别有1个记录,p1记录数为0,那么接下来我们通过查询information_schema.PARTITIONS表来验证。
之前我们知道range和list分区,如果表中存在primary key或者unique key,则对应分区的列必须是这些key的子集,那么对hash是否有同样的约束呢,字符类型的列是否可以作为hash分区?接下来我们立刻以实验为基础进行验证。
首先把之前的分区先删除掉,执行如下命令:
发现drop partition命令只能用在RANGE和LIST分区中。
说明: 如果将要分区的表有一个唯一的键,那么用来作为 HASH 用户函数的自变数或者主键的 column_list 的自变数的任意列都必须是那个键的一部分。
下面试一下,字符串列是否可以作为hash分区的列,按照上面的讨论和说明,我们认为是不行的,因为hash的计算本质是mod运算,必须是整数。实验如下:
实验证明:hash的分区必须是整数列。
可以通过下面的命令,进行重新分区:
alter table hash_partition_tbl partition by hash(a) partitions 4;