当系统数据量发展到一定程度后,往往需要进行数据库的垂直切分和水平切分,以实现负载均衡和性能提升,而数据切分后随之会带来多数据源整合等等问题。如果仅仅从应用程序的角度去解决这类问题,无疑会加重应用程度的复杂度,因此需要一个成熟的第三方解决方案。
Amoeba正是解决此类问题的一个开源方案,Amoeba位于应用程序和数据库服 务器之间,相当于提供了一个代理,使得应用程序只要连接一个Amoeba,相当于只是在操作一个单独的数据库服务器,而实际上却是在操作多个数据库服务 器,这中间的工作全部交由Amoeba去完成。
本文针对基于MySQL的水平切分的实现机制,讲解Amoeba For MySQL的简单应用。
一、背景介绍
使用数据库:MySQL
数据库节点1:127.0.0.1
数据库节点2:10.167.157.176
数据库名:yunzhu
切分的表:用户表(user_info)
切分的参数:用户ID(USERID)
切分规则:
用户ID小于等于100的数据存到数据库节点1,
用户ID大于100的数据存到数据库节点2
user_info表结构如下:
- CREATE TABLE `user_info` (
- `USERID` INT (10) NOT NULL DEFAULT '0' ,
- `USERNAME` VARCHAR (50) NULL DEFAULT NULL ,
- PRIMARY KEY (`USERID`)
- )
数据库节点1中user_info表中的数据:
+--------+-----------+ | USERID | USERNAME | +--------+-----------+ | 73 | Chen Feng | | 88 | China | +--------+-----------+
数据库节点1中user_info表中的数据:
+--------+----------+ | USERID | USERNAME | +--------+----------+ | 108 | Jiang Su | | 200 | NanJing | +--------+----------+
Amoeba版本:
amoeba-mysql-binary-2.2.0
下载地址:
下载后直接解压即可使用
二、配置Amoeba
配置文件全部位于conf目录下
1、amoeba.xml
配置连接Amoeba程序的用户名和密码:
- < property name = "user" > root </ property >
- < property name = "password" > chenfeng123 </ property >
2、dbServers.xml
先配置一个抽象的父节点,定义多个数据库节点的共通的信息,包括数据库节点的端口、schema、用户名和密码:
- < dbServer name = "abstractServer" abstractive = "true" >
- < factoryConfig class = "com.meidusa.amoeba.mysql.net.MysqlServerConnectionFactory" >
- ......
- <!-- mysql port -->
- < property name = "port" > 3306 </ property >
- <!-- mysql schema -->
- < property name = "schema" > yunzhu </ property >
- <!-- mysql user -->
- < property name = "user" > root </ property >
- <!-- mysql password -->
- < property name = "password" > chenfeng </ property >
- </ factoryConfig >
- ......
- </ dbServer >
再配置两个数据库节点,继承上面的父节点,然后配置各自的IP地址即可:
- < dbServer name = "server1" parent = "abstractServer" >
- < factoryConfig >
- <!-- mysql ip -->
- < property name = "ipAddress" > 127.0.0.1 </ property >
- </ factoryConfig >
- </ dbServer >
- < dbServer name = "server2" parent = "abstractServer" >
- < factoryConfig >
- <!-- mysql ip -->
- < property name = "ipAddress" > 10.167.157.176 </ property >
- </ factoryConfig >
- </ dbServer >
3、rule.xml
配置切分规则:
1、schema指定数据库名,name指定表名,defaultPools指定关联的数据库节点(指定哪几个节点就从哪几个节点里面查数据)
2、切分规则:
1)用户ID小于100的数据存到数据库节点1
2)用户ID大于100的数据存到数据库节点2
- < amoeba:rule xmlns:amoeba = "http://amoeba.meidusa.com/" >
- < tableRule name = "user_info" schema = "yunzhu" defaultPools = "server1,server2" >
- < rule name = "rule1" >
- < parameters > USERID </ parameters >
- < expression > <![CDATA[ USERID <= 100]]> </ expression >
- < defaultPools > server1 </ defaultPools >
- < readPools > server1 </ readPools >
- < writePools > server1 </ writePools >
- </ rule >
- < rule name = "rule2" >
- < parameters > USERID </ parameters >
- < expression > <![CDATA[ USERID > 100 ]]> </ expression >
- < defaultPools > server2 </ defaultPools >
- < writePools > server2 </ writePools >
- < readPools > server2 </ readPools >
- </ rule >
- </ tableRule >
- </ amoeba:rule >
三、运行及验证
1、启动Amoeba
通过bin目录下的amoeba.bat启动:
- amoeba start
启动后控制台打印如下信息,可以看到:
- log4j:WARN log4j config load completed from file:D:\JavaTools\amoeba-mysql-binar
- y- 2.2 . 0 \bin\..\conf\log4j.xml
- 2013 - 01 - 08 09 : 32 : 27 , 765 INFO context.MysqlRuntimeContext - Amoeba for Mysql cur
- rent versoin= 5.1 . 45 -mysql-amoeba-proxy- 2.2 . 0
- log4j:WARN ip access config load completed from file:D:\JavaTools\amoeba-mysql-b
- inary- 2.2 . 0 \bin\../conf/access_list.conf
- 2013 - 01 - 08 09 : 32 : 27 , 921 INFO net.ServerableConnectionManager - Amoeba for Mysql
- listening on 0.0 . 0.0 / 0.0 . 0.0 : 8066 .
- 2013 - 01 - 08 09 : 32 : 27 , 921 INFO net.ServerableConnectionManager - Amoeba Monitor S
- erver listening on / 127.0 . 0.1 : 40170 .
2、连接Amoeba
通过mysql客户端连接Amoeba,端口指定为8066,然后还像以前操作MySQL一样进行操作:
- D:\>mysql -P8066 -uroot -pchenfeng123
- Welcome to the MySQL monitor. Commands end with ; or \g.
- Your MySQL connection id is 21616774 to server version: 5.1 . 45 -mysql-amoeba-prox
- y- 2.2 . 0
- Type 'help;' or '\h' for help. Type '\c' to clear the buffer.
- mysql>
3、验证数据的查询
查询yunzhu库下的user_info表的数据,如下:
- mysql> select * from yunzhu.user_info;
- + --------+-----------+
- | USERID | USERNAME |
- + --------+-----------+
- | 108 | Jiang Su |
- | 200 | NanJing |
- | 73 | Chen Feng |
- | 88 | China |
- + --------+-----------+
- 4 rows in set (0.02 sec)
可以看到,现在查到了两个数据库节点中的user_info表中的所有记录。
4、验证数据的插入
这里插入两条数据,一条USERID为55,另一条USERID为155,如下:
- mysql> insert into yunzhu.user_info(USERID,USERNAME) values( 55 , 'test55' );
- Query OK, 1 row affected ( 0.13 sec)
- mysql> insert into yunzhu.user_info(USERID,USERNAME) values( 155 , 'test155' );
- Query OK, 1 row affected ( 0.05 sec)
查询数据库节点1:
- D:\>mysql -uroot -pchenfeng
- Welcome to the MySQL monitor. Commands end with ; or \g.
- Your MySQL connection id is 33 to server version: 5.0 . 18 -nt
- Type 'help;' or '\h' for help. Type '\c' to clear the buffer.
- mysql> select * from yunzhu.user_info;
- +--------+-----------+
- | USERID | USERNAME |
- +--------+-----------+
- | 55 | test55 |
- | 73 | Chen Feng |
- | 88 | China |
- +--------+-----------+
- 3 rows in set ( 0.00 sec)
查询数据库节点2:
- D:\>mysql -uroot -pchenfeng -h10. 167.157 . 176
- Welcome to the MySQL monitor. Commands end with ; or \g.
- Your MySQL connection id is 34 to server version: 5.0 . 18 -nt
- Type 'help;' or '\h' for help. Type '\c' to clear the buffer.
- mysql> select * from yunzhu.user_info;
- +--------+----------+
- | USERID | USERNAME |
- +--------+----------+
- | 108 | Jiang Su |
- | 155 | test155 |
- | 200 | NanJing |
- +--------+----------+
- 3 rows in set ( 0.00 sec)
可以发现USERID为55的记录插入到了数据库节点1中,USERID为155的记录插入到了数据库节点2中。
因为根据rule.xml中的切分规则,USERID小于等于100的的记录存在数据库节点1中,而大于100的则存在数据库节点2中。
四、注意一些限制
这是我在实践中发现的,刚开始不知道存在这样的限制,以致于浪费了很多时间,以为配置有问题,搞了很久才发现原来是因为这些限制才导致没有出现预期的结果,所以必须要注意:
1、不管是查询和插入,每条都必须显式地指定数据库名(yunzhu),否则只会从一个数据库节点中查询数据,或者所有数据全部会插入一个数据库节点中。
2、插入数据时,必须显式地指定列名,如“insert into yunzhu.user_info(USERID,USERNAME)”,否则切分规则不会生效,所有记录都会插入到一个数据库节点中。