将行政区域导入SQL SERVER

系统 1672 0

步骤如下:

一、到国家统计局网站,找到县及县以上行政区划页面。

我找到的是这个: http://www.stats.gov.cn/tjbz/xzqhdm/t20130118_402867249.htm

然后将页面上的代码直接复制粘贴到记事本,保存为 e:\temp\region.txt。

(注意复制时,可能是受内存限制,不一定能一次性复制完全所有内容,注意确认一下。)

复制粘贴的结果,让我傻眼了:

将行政区域导入SQL SERVER

居然是邮政编码与名称各自一行的。手动改成一行?写个程序来纠正?蚊子都睡了。

 

二、硬着头皮用SQL SERVER Management Studio导进去。

导入的时候注意一点,就是要在目标表里设置一个标识列。如图:

将行政区域导入SQL SERVER

 

三、生成区域表

在这里导进去的目标表,只是一个临时用的中间表:region_tmp,我真正要的,是表region。

中间表region_tmp的结构:

region_tmp
======================
id           int  identity(1,1)
cn          varchar(50)

导进去以后,数据如下:

将行政区域导入SQL SERVER

 

而我想要的区域表region

region
=========================
id              int identity(1,1) 
code        char(6)
name       nvarchar(50)
parentId   int

 

所以现在需要将数据再从region_tmp ==> region。

在导入的时候,之所以要设置一个标识列,就是用来区分邮政编码和地名。在region_tmp,奇数行都是编码,偶数行则是地名,因此可以通过以下语句将编码和地名都写进region的同一行:

 

    INSERT INTO [dbo].[Region]

           ([code]

           ,[name]

           ,[parentId])

SELECT a.cn,b.cn,0

	FROM region_tmp a,region_tmp b

	WHERE b.id=a.id+1

	and (a.id % 2) = 1
  


四、修改区域表

 

现在要修改字段region.parentId。就是每个地名记录要有一个父ID,在使用的时候好排序。比如广州的父ID是广东省,天河区的父ID是广州。

 

    --设置市级地名的父ID

UPDATE [dbo].[region]

	SET parentid=b.id

	FROM [region],[region] b

	WHERE LEFT([region].code,2)=LEFT(b.code,2)

		AND RIGHT([region].code,4)<>'0000' AND RIGHT([region].code,2)='00'

		AND RIGHT(b.code,4)='0000';

		

--设置县级地名的父ID

UPDATE [dbo].[region]

	SET parentid=b.id

	FROM [region],[region] b

	WHERE LEFT([region].code,4)=LEFT(b.code,4)

		AND RIGHT([region].code,2)!='00'

		AND RIGHT(b.code,2)='00';
  


大功告成,可惜没有双儿。

 

 

 

 

 

 

将行政区域导入SQL SERVER


更多文章、技术交流、商务合作、联系博主

微信扫码或搜索:z360901061

微信扫一扫加我为好友

QQ号联系: 360901061

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请用微信扫描下面二维码支持博主2元、5元、10元、20元等您想捐的金额吧,狠狠点击下面给点支持吧,站长非常感激您!手机微信长按不能支付解决办法:请将微信支付二维码保存到相册,切换到微信,然后点击微信右上角扫一扫功能,选择支付二维码完成支付。

【本文对您有帮助就好】

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请用微信扫描上面二维码支持博主2元、5元、10元、自定义金额等您想捐的金额吧,站长会非常 感谢您的哦!!!

发表我的评论
最新评论 总共0条评论