SnowNLP是国人开发的python类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和TextBlob不同的是,这里没有用NLTK,所有的算法都是自己实现的,并且自带了一些训练好的字典。注意本程序都是处理的unicode编码,所以使用时请自行decode成unicode。MIT许可下发行。其github主页我自己修改了上文链接中的python代码
系统 2019-09-27 17:54:43 2304
1原理2检测步骤将参数空间(ρ,θ)量化成m*n(m为ρ的等份数,n为θ的等份数)个单元,并设置累加器矩阵,初始值为0;对图像边界上的每一个点(x,y)带入ρ=xcosθ+ysinθ,求得每个θ对应的ρ值,并在ρ和θ所对应的单元,将累加器加1,即:Q(i,j)=Q(i,j)+1;检验参数空间中每个累加器的值,累加器最大的单元所对应的ρ和θ即为直角坐标系中直线方程的参数。3接口image:二值图像,canny边缘检测输出。这里是result。rho:以像素为
系统 2019-09-27 17:53:36 2304
这里使用requests库爬取网页要比urllib库方便用finditer查询importrequestsimportreurl='https://www.flyai.com/'#带爬取的网页html=requests.get(url).text#text为转化为str数据pat='(\w+@\w+.com)|(\d{11})'#正则模式res=re.finditer(pat,html)#finditer返回的是一个迭代器foriinres:#i是一个Ma
系统 2019-09-27 17:52:10 2304
1.从docker仓库拉取redis镜像dockerpullredis2.在/home下分别创建redis-6379-data,redis-6380-data,redis-6381-data3.拷贝/etc/redis/redis.conf到/home下4.复制redis.conf为redis-6379.conf,redis-6380.conf,redis.6381.con并且分别修改其中的配置,logfile指定不同的文件port6380logfile"
系统 2019-09-27 17:50:32 2304
Python开发中有哪些高级技巧?这是知乎上一个问题,我总结了一些常见的技巧在这里,可能谈不上多高级,但掌握这些至少可以让你的代码看起来Pythonic一点。如果你还在按照类C语言的那套风格来写的话,在codereview恐怕会要被吐槽了。列表推导式>>>chars=[cforcin'python']>>>chars['p','y','t','h','o','n']字典推导式>>>dict1={'a':1,'b':2,'c':3,'d':4,'e':5}>
系统 2019-09-27 17:50:17 2304
目录1.获取工作目录和设置工作目录2.获取日期处理3.列表的倒排序4.使用apply处理两个值的代码5.断言函数assert6.yield生成器7.获取程序运行时间8.动态生成变量9.数据可持续化操作10.数据运行时间211.创建目录12.删除无用的数据13.字符串格式化14.zip自动生成字典15.各种包的离线下载地址16.路径的设置17.数据添加ignore_index的使用技巧18.删除nan的总结19.批量重命名20.nohup的使用21.rese
系统 2019-09-27 17:49:55 2304
文件操作文件操作介绍打开打开方式File对象的属性文件的读写File对象的常用方法读写定位关闭os模块详解os简介常用功能关于操作系统关于文件与目录路径操作json和pickle模块详解json简介python类型数据和JSON数据格式互相转换规则jsontopythonpythontojson数据类型编解码序列化及反序列化常用参数pickle简介JSON和pickle模块的区别文件操作介绍打开默认数据是加载到内存中,结果也是保存到内存中,程序执行结束,所
系统 2019-09-27 17:49:28 2304
摘要:Ffrpc可以很方便的构建c++server,在网游服务器程序开发中,进程间通讯非常的重要,比如gateserver和gameserver或dbserver之间的通信。而ffrpc可以使得进程间通信非常简单,是由于ffrpc的broker模式封装了位置无关性,使得如gate调用gameserver的接口只需要知道对方的服务名,从而使得程序中各个节点的关系与系统的拓扑关系是完美吻合的。这也使得系统的架构更加清晰,系统的实现更健壮和易维护。之前ffrpc
系统 2019-09-27 17:48:59 2304
此程序以李毅吧为例子,以面向对象的设计思想实现爬取保存网页数据,暂时并未用到并发处理,以后有机会的话会加以改善首先去百度贴吧分析贴吧地址栏中url后的参数,找到分页对应的参数pn,贴吧名字对应的参数kw首先创建类,写好__init__方法,run方法,__init__方法里先可以直接写passrun方法里大概整理一下整体的思路构造url列表,因为要爬取1000页,每页需对应一个url遍历发送请求,获取响应保存将可封装的步骤封装到单独的方法,所以这里又增加了
系统 2019-09-27 17:46:58 2304
下一页1.HTML是静态的,JSP是动态的,交互式的,而且可由用户定制。2.服务器:可能是物理主机(硬件),也可能是Web服务器应用(软件)。客户:指人类用户,或浏览器应用。Web客户允许用户请求服务器上的某个资源,并且向用户显示请求结果。3.服务器和客户的通信服务器和客户之间对话的共同的语言是HTTP。服务器使用HTTP向客户发送信息。4.HTTP请求:HTTP方法(Get、Post),要访问的页面,表单参数。响应:状态码,内容类型(文本、图片、HTML
系统 2019-08-29 23:49:23 2304