- 军军小站|张军博客
拥有Python标签的文章
Python

Python中文文本分句 sentence tokenize

由于nltk等都没有实现句子级别的tokenize,或者文本分句。这里使用python正则,快速实现一个,可以把文本分成若干个小句子。代码如下,如果你想要实现自己个性化的分句,例如只考虑“。!”等的分句,可以调整正则项,“|”代表或的意思。defsent_tokenize(x):sents_temp=re.split('(:|:|,|,|。|!|\!|\.|?|\?)',x)sents=[]foriinrange(len(sents_temp)//2):s

系统 2019-09-27 17:47:38 2346

Python

Python开发GUI工具介绍,实战:将图片转化为素描画!

欢迎添加华为云小助手微信(微信号:HWCloud002或HWCloud003),输入关键字“加群”,加入华为云线上技术讨论群;输入关键字“最新活动”,获取华为云最新特惠促销。华为云诸多技术大咖、特惠活动等你来撩!Python开发GUI今天一位从我公众号开始结识的朋友,询问关于如何快速编写一个exe工具的问题。由于功能简单且之前无相关GUI编程基础,为了快速完成开发,我向他推荐了easygui模块。python作为胶水语言,几乎没有不能做的事情,但个人一直觉

系统 2019-09-27 17:45:50 2346

Python

基于Python的图像数据增强Data Augmentation解析

1.1简介深层神经网络一般都需要大量的训练数据才能获得比较理想的结果。在数据量有限的情况下,可以通过数据增强(DataAugmentation)来增加训练样本的多样性,提高模型鲁棒性,避免过拟合。在计算机视觉中,典型的数据增强方法有翻转(Flip),旋转(Rotat),缩放(Scale),随机裁剪或补零(RandomCroporPad),色彩抖动(Colorjittering),加噪声(Noise)笔者在跟进视频及图像中的人体姿态检测和关键点追踪(Huma

系统 2019-09-27 17:57:27 2345

Python

Python批量删除mysql中千万级大量数据

场景描述线上mysql数据库里面有张表保存有每天的统计结果,每天有1千多万条,这是我们意想不到的,统计结果咋有这么多。运维找过来,磁盘占了200G,最后问了运营,可以只保留最近3天的,前面的数据,只能删了。删,怎么删?因为这是线上数据库,里面存放有很多其它数据表,如果直接删除这张表的数据,肯定不行,可能会对其它表有影响。尝试每次只删除一天的数据,还是卡顿的厉害,没办法,写个Python脚本批量删除吧。具体思路是:每次只删除一天的数据;删除一天的数据,每次删

系统 2019-09-27 17:57:14 2345

Python

Python中使用高德API实现经纬度转地名

场景高德API提供给开发者们一些常用功能的接口,其中有一种叫地理/逆地理编码能实现地名查询经纬度和经纬度查地名。实现高德API平台:https://lbs.amap.com/注册并登陆找到Web服务然后点击获取key,按照指示获取自己的key。按照其逆地理编码的API,只需要发送一个GET请求并带着指定参数即可。这里我们先使用PostMan进行测试。最简单的就是只有两个参数,一个是刚才申请的key,一个是经纬度。接下来使用Python进行请求测试新建pyt

系统 2019-09-27 17:55:26 2345

Python

, not bytes报错原因及Python3写入二进制文件方法

Python2随机写入二进制文件:defsave(text,filename='temp',path='download'):fpath=os.path.join(path,filename)withopen(fpath,'w')asf:print('output:',fpath)f.write(text)但使用Python3会报错:TypeError:mustbestr,notbytes原因为:Python3给open函数添加了名为encoding的新参

系统 2019-09-27 17:52:52 2345

Python

01 Python爬虫之Requests库入门

目录Requests库Requests库的7个主要方法Requests库的get()方法Requests库的head()方法Response对象的属性理解Requests库的异常爬取网页的通用代码框架HTTP协议协议对资源的操作理解PATCH和PUT的区别HTTP协议与Requests库Requests库主要方法解析Requests库Requests库的7个主要方法方法说明requests.request()构造一个请求,支撑以下各方法的基础方法reque

系统 2019-09-27 17:51:54 2345

Python

Python流行ORM框架sqlalchemy安装与使用教程

本文实例讲述了Python流行ORM框架sqlalchemy安装与使用。分享给大家供大家参考,具体如下:安装http://docs.sqlalchemy.org1、安装#进入虚拟环境#执行./python3-mpipinstallimportsqlalchemyprint(sqlalchemy.__version__)#1.1.15我这里使用的版本是1.1.15创建连接对象http://docs.sqlalchemy.org/en/latest/orm/t

系统 2019-09-27 17:57:32 2344

Python

Python比较配置文件

工作中最常见的配置文件有四种:普通key=value的配置文件、Json格式的配置文件、HTML格式的配置文件以及YAML配置文件。这其中以第一种居多,后三种在成熟的开源产品中较为常见,本文只针对第一种配置文件。一般来说Linuxshell下提供了diff命令来比较普通文本类的配置文件,Python的difflib也提供了str和HTML的比较接口,但是实际项目中这些工具其实并不好用,主要是因为我们的配置文件并不是标准化统一化的。为了解决此类问题,最好针对

系统 2019-09-27 17:56:01 2344

Python

Python对接 xray 和微信实现自动告警

xray是什么xray是从长亭洞鉴核心引擎中提取出的社区版漏洞扫描神器,支持主动、被动多种扫描方式,自备盲打平台、可以灵活定义POC,功能丰富,调用简单,支持Windows/macOS/Linux多种操作系统,可以满足广大安全从业者的自动化Web漏洞探测需求。如何第一时间知道扫出了漏洞对于安全工程师来说,扫描器发现了漏洞能第一时间给出告警是非常重要的,因为安全工程师使用的是xray的基础爬虫模式,爬虫一直在爬也不会一直人工刷新和查看漏洞报告,也有可能是使用

系统 2019-09-27 17:54:33 2344

Python

python项目对接钉钉SDK的实现

钉钉SDK对接sdk还是遇到不少问题的钉钉python版SDK文档地址:https://dingtalk-sdk.readthedocs.io/zh_CN/latest/钉钉官方服务端文档:https://open-doc.dingtalk.com/microapp/serverapi2为了避免调试出现不必要的参数错误,前期钉钉配置要做好,血和泪的教训准备好下面几个参数DINGTALK_CORP_ID="重点:企业应用ID"#钉钉微应用DINGTALK_A

系统 2019-09-27 17:52:04 2344

Python

python下os模块强大的重命名方法renames详解

python下os模块强大的重命名方法renames详解在python中有很多强大的模块,其中我们经常要使用的就是OS模块,OS模块提供了超过200个方法来供我们使用,并且这些方法都是和数据处理相关的,这里介绍下重命名这个方法。OS的重命名方法是os.rename,我用的ipython,这个玩意很是强大,只要按下TAB键,可以帮助我们自动对齐和列出可以使用的方法,发现有2个方法,分别是rename和renames,2个方法,前面的rename使用过无数次,

系统 2019-09-27 17:56:33 2343

Python

python图像分割

1、图像分割原理图像分割(imagesegmentation)技术是计算机视觉领域的一个重要的研究方向,是图像语义理解的重要一环。图像分割是指将图像分成若干具有相似性质的区域的过程,从数学角度来看,图像分割是将图像划分成互不相交的区域的过程。近些年来随着深度学习技术的逐步深入,图像分割技术有了突飞猛进的发展,该技术相关的场景物体分割、人体前背景分割、人脸人体Parsing、三维重建等技术已经在无人驾驶、增强现实、安防监控等行业都得到广泛的应用。GraphC

系统 2019-09-27 17:53:33 2343

Python

Python实现平行坐标图的两种方法小结

平行坐标图,一种数据可视化的方式。以多个垂直平行的坐标轴表示多个维度,以维度上的刻度表示在该属性上对应值,相连而得的一个折线表示一个样本,以不同颜色区分类别。但是很可惜,才疏学浅,没办法在Python里实现不同颜色来区分不同的类别。如果对此比较在意的大神可以不要往下看了。。。。。。。。。上图是一个基于iris数据集所画的一个平行坐标图。隔开隔开.......................................隔开隔开不多扯了,下面正式上代码方法

系统 2019-09-27 17:48:19 2343

Python

Python如何调用JS文件中的函数

Python调用JS文件中的函数方法如下1、安装PyExecJS第三方库2、导入库:importexecjs3、调用JS文件中的方法Passwd=execjs.compile(open(r"web.js").read().decode("utf-8")).call('loginHandle','steam')语句解析,open后跟所执行的js文件位置,call后第一个单引号引起来的为所执行的js文件的某个function,第二个单引号是前面函数的参数这里为

系统 2019-09-27 17:54:54 2342