给定一篇文本(新闻),确定其归属地(地名)的python工具

系统 1393 0

简介

有时候需要确定一篇新闻文本的地名,比如

            
              上海市实施了垃圾分类...

            
          

其地名,即归属地是上海,本工具就是实现这个功能的。

给定一篇文章,可包含标题和正文(或仅标题,仅正文),确定其 归属地 (地名)。

  • 结果标准:
    • 区分国内国外,
    • 国外到国家名一级
    • 国内到省市一级

安装

  • 使用 python3
            
              $ git clone https://github.com/dongrixinyu/location_detect.git
$ cd location_detect
$ pip install .

            
          

使用方法

样例1

            
              
                import
              
               loc_reg
title 
              
                =
              
              
                '湖南2018年度企业环境信用评价公示 39家企业拟被评“不良”'
              
              
passage 
              
                =
              
              
                '今天,记者从湖南省生态环境厅获悉,我省2018年度企业环境信用评价拟定结果正在长沙市进行公示,拟评定环境诚信企业31家、环境合格企业1247家、环境风险企业121家、环境不良企业39家。'
              
              
                print
              
              
                (
              
              loc_reg
              
                .
              
              predict
              
                (
              
              title
              
                ,
              
               passage
              
                )
              
              
                )
              
            
          

结果为:

            
              
                {
              
              
                '国内'
              
              
                :
              
              
                [
              
              
                {
              
              
                '省'
              
              
                :
              
              
                '湖南'
              
              
                ,
              
              
                '市'
              
              
                :
              
              
                '长沙'
              
              
                }
              
              
                ]
              
              
                }
              
            
          

样例2

            
              passage 
              
                =
              
              
                '近日,布鲁塞尔爆发了大规模罢工游行,城市服务、商店、餐饮店均受到影响,原因和欧盟税收等政策有关。'
              
              
                print
              
              
                (
              
              loc_reg
              
                .
              
              predict
              
                (
              
              passage
              
                )
              
              
                )
              
            
          

结果为:

            
              
                {
              
              
                '国外'
              
              
                :
              
              
                [
              
              
                '比利时'
              
              
                ]
              
              
                }
              
            
          

说明

  • 从舆情新闻数据中随机抽取 100 篇自测,正确率 93%。其他类型文本未测试,效果待定。

如果觉得好用,请 follow 我一下 https://github.com/dongrixinyu


更多文章、技术交流、商务合作、联系博主

微信扫码或搜索:z360901061

微信扫一扫加我为好友

QQ号联系: 360901061

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请用微信扫描下面二维码支持博主2元、5元、10元、20元等您想捐的金额吧,狠狠点击下面给点支持吧,站长非常感激您!手机微信长按不能支付解决办法:请将微信支付二维码保存到相册,切换到微信,然后点击微信右上角扫一扫功能,选择支付二维码完成支付。

【本文对您有帮助就好】

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请用微信扫描上面二维码支持博主2元、5元、10元、自定义金额等您想捐的金额吧,站长会非常 感谢您的哦!!!

发表我的评论
最新评论 总共0条评论