SnowNLP是国人开发的python类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和TextBlob不同的是,这里没有用NLTK,所有的算法都是自己实现的,并且自带了一些训练好的字典。注意本程序都是处理的unicode编码,所以使用时请自行decode成unicode。MIT许可下发行。其github主页我自己修改了上文链接中的python代码
系统 2019-09-27 17:54:43 2265
经常会遇到下载的文件或电子书,名字中间都包含了一些网址信息,实际使用中由于名字太长不方便,下面的脚本使用正则表达式来对目录下的所有文件重命名:例如:修改前:[脚本之家]MacOSXforUnixGeeks[www.jb51.net].mobi修改后:MacOSXforUnixGeeks.mobipython代码如下:复制代码代码如下:importosimportredefrename_dir(dir,regex,f):ifnotos.path.isdir(
系统 2019-09-27 17:54:13 2265
1存储数据1.1媒体文件存储媒体文件有两种主要的方式:只获取文件URL链接,或者直接把源文件下载下来。在Python3.x版本中,urllib.request.urlretrieve可以根据文件的URL下载文件:fromurllib.requestimporturlretrievefromurllib.requestimporturlopenfrombs4importBeautifulSouphtml=urlopen("http://www.pythons
系统 2019-09-27 17:54:03 2265
int(x,[base])功能:函数的作用是将一个数字或base类型的字符串转换成整数。函数原型:int(x=0)int(x,base=10),base缺省值为10,也就是说不指定base的值时,函数将x按十进制处理。适用Python版本:Python2.xPython3.x注意:1.x可以是数字或字符串,但是base被赋值后x只能是字符串2.x作为字符串时必须是base类型,也就是说x变成数字时必须能用base进制表示Python英文文档解释:class
系统 2019-09-27 17:53:37 2265
如下所示:importre#过滤不了\\\中文()还有――――r1=u'[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\\]^_`{|}~]+'#用户也可以在此进行自定义过滤字符#者中规则也过滤不完全r2="[\s+\.\!\/_,$%^*(+\"\']+|[+――!,。?、~@#¥%……&*()]+"#\\\可以过滤掉反向单杠和双杠,/可以过滤掉正向单杠和双杠,第一个中括号里放的是英文符号,第二个中
系统 2019-09-27 17:52:30 2265
1、首先下载安装pycharm,安装后可参考https://blog.csdn.net/u014044812/article/details/97526288激活永久使用。2、File→NewProject3、项目创建成功后,设置一下pycharm创建文件时的模板信息File→Settings#!/usr/bin/envpython#-*-coding:utf-8-*-#@Time:${DATE}${TIME}#@Author:xxx#@File:${NA
系统 2019-09-27 17:52:24 2265
1、下载python3.6的安装包:wgethttps://www.python.org/ftp/python/3.6.0/Python-3.6.0.tgz2、解压后,进入到解压目录下,执行如下命令,将python3.6进行编译,如下是将python的环境编译到/usr/local/python3的目录下,注意先创建该目录:./configure�Cprefix=/usr/local/python33、安装makemakeinstall4、安装完成后,为了
系统 2019-09-27 17:52:03 2265
timeit模块timeit模块可以用来测试一小段Python代码的执行速度。classtimeit.Timer(stmt='pass',setup='pass',timer=)Timer是测量小段代码执行速度的类。stmt参数是要测试的代码语句(statment);setup参数是运行代码时需要的设置;timer参数是一个定时器函数,与平台有关。timeit.Timer.timeit(number=1000000)Timer类中测试语句执行速度的对象方法
系统 2019-09-27 17:46:21 2265
昨天小弟发现自己犯了个很严重的错误,那就是LGame的C#版启动类,在默认情况下没有调用父类Game的base.Update和base.Draw(base相当于Java版的super),导致XNA本身的渲染机制无法生效(LGame本身的渲染是正常的,缺了此两项,只是意味着引入XNA组件时,相关的XNA组件不会被渲染,操作也不会被执行罢了……),连累着插入XNA的广告组件也无法显示(话说改下源码,在相关函数重载部分调用上述两项就会正常了)~为了弥补前失,所以
系统 2019-08-29 23:43:23 2265
连线杂志主编克里斯·安德森直言不讳地宣称从iPad看到了电子出版的未来。不管你信不信,我反正是信了。iPad上一款名为myMemoir的应用更加让我相信电子出版将创造新的奇迹。还停留在用智能设备看电子出版物的阶段吗?赶紧试试这款强大的应用吧,简单操作几下,它就能让你的角色从读者变成作者。只要1.99美金就能一圆你的作家梦,是不是很划算?应用介绍及主要功能每个人都有千奇百怪的想法和创意,有些逐渐消失在记忆中,有些人则会通过写日记等方式将它们记录下来,遗憾地是
系统 2019-08-29 23:38:19 2265