- 军军小站|张军博客
搜索到与相关的文章
Python

python 文本相似度计算

参考:python文本相似度计算原始语料格式:一个文件,一篇文章。#!/usr/bin/envpython#-*-coding:UTF-8-*-importjiebafromgensimimportcorpora,models,similaritiesimportcodecsdefcut_words(file):withopen(file,'r',encoding="utf-8")asf:text=f.read()words=jieba.lcut(text

系统 2019-09-27 17:48:40 1856

Python

好程序员Python学习路线分享实现归并排序算法

Python实现归并排序算法归并排序1945年由约翰·冯·诺伊曼首次提出。该算法是采用分治法(DivideandConquer)的一个非常典型的应用,且各层分治递归可以同时进行。分治法的基本思想将原问题分解为若干个规模更小但结构与原问题相似的子问题。递归地解这些子问题,然后将这些子问题的解组合为原问题的解。归并排序的基本思想排序一个数组,我们先把数组从中间分成前后两部分,然后对前后两部分分别排序,再将排好序的两部分合并在一起,这样整个数组就都有序了。动画(

系统 2019-09-27 17:48:16 1856

Python

在Python中操作列表之List.pop()方法的使用

pop()方法从列表移除并返回最后一个对象或obj。语法以下是pop()方法的语法:list.pop(obj=list[-1])参数obj--这是一个可选参数,该对象的索引可以从该列表中删除返回值此方法返回从列表中移除对象例子下面的例子显示了pop()方法的使用#!/usr/bin/pythonaList=[123,'xyz','zara','abc'];print"AList:",aList.pop();print"BList:",aList.pop(2

系统 2019-09-27 17:46:58 1856

Python

Python 共享变量加锁、释放详解

一、共享变量共享变量:当多个线程访问同一个变量的时候。会产生共享变量的问题。例子:importthreadingsum=0loopSum=1000000defmyAdd():globalsum,loopSumforiinrange(1,loopSum):sum+=1defmyMinu():globalsum,loopSumforiinrange(1,loopSum):sum-=1if__name__=="__main__":print("Dont,,,,,

系统 2019-09-27 17:45:59 1856

Python

Python实现网页截图(PyQT5)过程解析

方案说明功能要求:实现网页加载后将页面截取成长图片涉及模块:PyQT5PIL逻辑说明:1:完成窗口设置,利用PyQT5QWebEngineView加载网页地址,待网页加载完成后,调用check_pag;classMainWindow(QMainWindow):def__init__(self,parent=None):super(MainWindow,self).__init__(parent)self.setWindowTitle('易哈佛')self.

系统 2019-09-27 17:45:49 1856

Python

python 爬取网易云音乐评论

网易云音乐的评论里总会有大批的神评论,突发灵感想写个爬虫爬取评论,后来发现百度的方法都需要AES加密的密钥,太麻烦了,本人小白表示看不懂,在知乎上看到网易云有API接口可以直接爬取,不需要任何密钥。具体代码如下:#coding:utf-8importreimporttimefromurllibimportrequestclassPL:def__init__(self):#定义初始信息#定义http头信息self.headers={"User-Agent":

系统 2019-09-27 17:45:44 1856

Python

分析python请求数据

本节讲解了flask的请求,如果想在没有请求的情况下获取上下文,可以使用test_request_context()或者request_context(),从request对象的form中可以获取表单的数据,args中可以获取URL中的参数,files可以获取上传的文件,cookies可以操作cookie。首先你需要从flask模块中导入request:fromflaskimportrequest当前请求的方法可以用method属性来访问。你可以用form

系统 2019-09-27 17:38:46 1856

Python

教你用python3根据关键词爬取百度百科的内容

前言关于python版本,我一开始看很多资料说python2比较好,因为很多库还不支持3,但是使用到现在为止觉得还是pythin3比较好用,因为编码什么的问题,觉得2还是没有3方便。而且在网上找到的2中的一些资料稍微改一下也还是可以用。好了,开始说爬百度百科的事。这里设定的需求是爬取北京地区n个景点的全部信息,n个景点的名称是在文件中给出的。没有用到api,只是单纯的爬网页信息。1、根据关键字获取url由于只需要爬取信息,而且不涉及交互,可以使用简单的方法

系统 2019-09-27 17:38:45 1856

Python

Python MongoDB 插入数据时已存在则不执行,不存在则插入的解决方法

本文实例讲述了PythonMongoDB插入数据时已存在则不执行,不存在则插入的解决方法。分享给大家供大家参考,具体如下:前言:想把QQ日志爬虫(Python)爬下来的日志保存到MongoDB里面。但insert的时候报错:E11000duplicatekeyerrorcollection:QQ.Blogindex:_id_dupkey:{:"965464518_1301232446"}后来知道错误的原因是:插入的数据和已有数据的ID重复了。我想要的是:插

系统 2019-09-27 17:38:32 1856

Python

C++/Php/Python 语言执行shell命令的方法(推荐)

编程中经常需要在程序中使用shell命令来简化程序,这里记录一下。1.C++执行shell命令#include#include#includeintexec_cmd(std::stringcmd,std::string&res){if(cmd.size()==0){//cmdisemptyreturn-1;}charbuffer[1024]={0};std::stringresult="";FILE*pin=popen(cmd.c_str(),"r");i

系统 2019-09-27 17:38:25 1856