搜索到与相关的文章
Python

python调用hanlp进行命名实体识别

阅读更多本文分享自6丁一的猫的博客,主要是python调用hanlp进行命名实体识别的方法介绍。以下为分享的全文。1、python与jdk版本位数一致2、pipinstalljpype1(python3.5)3、类库hanlp.jar包、模型data包、配置文件hanlp.properties放在一个新建目录4、修改hanlp.properties中root根目录,找到data代码调用如下:1|#coding:utf-82|'''3|Createdon20

系统 2019-09-27 17:52:23 1992

Python

Python文件和目录操作详解

一、文件的打开和创建1、打开复制代码代码如下:open(file,mode):>>>fo=open('test.txt','r')>>>fo.read()'hello\n'>>>fo.close()file(file,mode):>>>f=file('test.txt','r')>>>f.read()'hello\n'>>>f.close()mode可取值:2、创建用w/w+/a/a+模式打开即可。二、文件的读取1、String=FileObject.re

系统 2019-09-27 17:52:20 1992

Python

python内存动态分配过程详解

一、前言大多数编译型语言,变量在使用前必须先声明,其中C语言更加苛刻:变量声明必须位于代码块最开始,且在任何其他语句之前。其他语言,想C++和java,允许“随时随地”声明变量,比如,变量声明可以在代码块的中间,不过仍然必须在变量被使用前声明变量的名字和类型。在Python中,无序此类显式变量声明语句,变量在第一次被赋值时自动声明。和其他大多数语言一样,变量只有被创建和赋值后才能被使用。#变量未声明>>>xTraceback(mostrecentcalll

系统 2019-09-27 17:52:14 1992

Python

Python 求对数

文章目录1.描述2.语法3.参数4.返回值5.实例演战5.1.求解$\ln2$5.2.求解$\log_210$1.描述log()返回x的自然对数。2.语法以下是log()方法的语法:importmathmath.log(x[,base])注意:log()是不能直接访问的,需要导入math模块,通过静态对象调用该方法。3.参数x–数值表达式。base–可选,底数,默认为e。4.返回值返回x的自然对数,x>0。5.实例演战5.1.求解ln⁡2\ln2ln2im

系统 2019-09-27 17:52:07 1992

Python

python爬虫豆瓣网的模拟登录实现

思路一、想要实现登录豆瓣关键点分析真实post地址----寻找它的formdata,如下图,按浏览器的F12可以找到。实战操作实现:模拟登录豆瓣,验证码处理,登录到个人主页就算是success数据:没有抓取数据,此实战主要是模拟登录和处理验证码的学习。要是有需求要抓取数据,编写相关的抓取规则即可抓取内容。登录成功展示如图:spiders文件夹中DouBan.py主要代码如下:#-*-coding:utf-8-*-importscrapy,urllib,re

系统 2019-09-27 17:52:01 1992

Python

Python-time库的使用

time库是Python中处理时间的标准库计算机时间的表达提供获取系统时间并格式化输出功能提供系统级精确计时功能,用于程序性能分析time库包括三类函数时间获取:time()ctime()gmtime()时间格式化:strftime(0strptime()程序计时:sleep(),perf_counter()时间获取time()获取当前时间戳,即计算机内部时间值,浮点数importtimetime.time();#运行结果#1568855802.08770

系统 2019-09-27 17:50:57 1992

Python

python 函数中的内置函数及用法详解

今天来介绍一下Python解释器包含的一系列的内置函数,下面表格按字母顺序列出了内置函数:下面就一一介绍一下内置函数的用法:1、abs()返回一个数值的绝对值,可以是整数或浮点数等。print(abs(-18))print(abs(0.15))result:180.152、all(iterable)如果iterable的所有元素不为0、''、False或者iterable为空,all(iterable)返回True,否则返回False。print(all(

系统 2019-09-27 17:50:56 1992

Python

Python实现数据可视化看如何监控你的爬虫状态【推荐】

今天主要是来说一下怎么可视化来监控你的爬虫的状态。相信大家在跑爬虫的过程中,也会好奇自己养的爬虫一分钟可以爬多少页面,多大的数据量,当然查询的方式多种多样。今天我来讲一种可视化的方法。关于爬虫数据在mongodb里的版本我写了一个可以热更新配置的版本,即添加了新的爬虫配置以后,不用重启程序,即可获取刚刚添加的爬虫的状态数据。1.成品图这个是监控服务器网速的最后成果,显示的是下载与上传的网速,单位为M。爬虫的原理都是一样的,只不过将数据存到InfluxDB的

系统 2019-09-27 17:50:52 1992

Python

Python的MRO

Python的MRO即MethodResolutionOrder(方法解析顺序),也就是在Python中的类的继承顺序是怎样的。在Python2.3之前,MRO的实现是基于DFS的,而在Python2.3以后MRO的实现是基于C3算法(我这里两种算法的具体实现都不详述)。C3算法最早被提出是用于Lisp的,应用在Python中是为了解决原来基于深度优先搜索算法不满足本地优先级,和单调性的问题。本地优先级:指声明时父类的顺序,比如C(A,B),如果访问C类对

系统 2019-09-27 17:50:47 1992

Python

Python 版的

作者:LogM本文原载于https://segmentfault.com/u/logm/articles,不允许转载~1.源码来源TextRank4ZH源码:https://github.com/letiantian/TextRank4ZH.git本文对应的源码版本:committedon3Jul2018,fb1339620818a0b0c16f5613ebf54153faa41636TextRank论文地址:https://www.aclweb.org/

系统 2019-09-27 17:50:38 1992