搜索到与相关的文章
Python

Python提取文本tf、idf

"""python提取文本的tfidf特征"""importmathfromcollectionsimportCounter#1.语料库corpus=['thisisthefirstdocument','thisisthesecondseconddocument','andthethirdone','isthisthefirstdocument']#2.对语料进行分词word_list=[]foriinrange(len(corpus)):word_lis

系统 2019-09-27 17:57:10 2069

Python

python2爬取百度贴吧指定关键字和图片代码实例

目的:在百度贴吧输入关键字和要查找的起始结束页,获取帖子里面楼主所发的图片思路:获取分页里面的帖子链接列表获取帖子里面楼主所发的图片链接列表保存图片到本地注意事项:问题:在谷歌浏览器使用xpathhelper插件时有匹配结果,但在程序里面使用python内带的xpath匹配却为空的原因。原因:不同服务器会对不同的浏览器返回不同的数据,导致在谷歌浏览器看到的和服务器返回的有区别解决方法:使用IE浏览器的User-agenet,而且越老的版本,报错几率相对越小

系统 2019-09-27 17:57:03 2069

Python

猴子吃桃问题-python版

#!/usr/bin/envpython#-*-coding:utf-8-*-#题目:猴子吃桃问题:猴子第一天摘下若干个桃子,当即吃了一半,还不瘾,又多吃了一个#第二天早上又将剩下的桃子吃掉一半,又多吃了一个。以后每天早上都吃了前一天剩下#的一半零一个。到第10天早上想再吃时,见只剩下1个桃子了。求第一天共摘了多少。#求解思路:设后一天的桃子数量为x,则前一天剩余的桃子数量为(x+1)×2#例如:第10天剩余1个#第9天剩余(1+1)×2=4个#第8天剩余

系统 2019-09-27 17:56:36 2069

Python

Python 文件处理注意事项总结

Python文件处理注意事项总结文件处理在编程中是常见的操作,文件的打开,关闭,重命名,删除,追加,复制,随机读写非常容易理解和使用。需要注意的是文件的安全关闭,采用with语句轻松便捷:withopen(pathname,”r”)asmyfile:do_some_with(myfile)1.CSV的文件处理csv模块可以很好地处理csv文件,而Pandas模块则可以较好的处理大型的csv文件,还可以处理HTML等,并提供分块处理。2.XML的文件处理对于

系统 2019-09-27 17:56:11 2069

Python

python中的*args和**kwargs

python支持可变参数:可以使用*args、**kwargs实现*args是可变的positionalarguments列表,是一个tuple。**kwargs是可变的keywordarguments列表,是一个dict。*args必须位于**kwargs之前,因为positionalarguments必须位于keywordarguments之前。*args、**kwargs的使用:函数定义:是一个将参数pack的过程函数调用:将参数unpack例子:d

系统 2019-09-27 17:55:35 2069

Python

python3 一个处理数据的案例

读取文件,将每一行作为列表的一个值,求每个字符串出现的次数,以及有哪些字符串。写入文件,按次数大小排序,次数后面对应着字符串#-*-coding:utf-8-*-input1=open('jpc.txt','r')output1=open('out.txt','w')list_of_all_the_lines=input1.read()a=list_of_all_the_lines.splitlines(False)myset=set(a)mylist_c

系统 2019-09-27 17:55:22 2069

Python

Python使用random模块生成随机数操作实例详解

本文实例讲述了Python使用random模块生成随机数操作。分享给大家供大家参考,具体如下:今天在用Python编写一个小程序时,要用到随机数,于是就在网上查了一下关于Python生成各种随机数的方法,现将其总结如下:此处,利用Python中的random模块生成随机数。因此首先必须导入该模块:importrandom一.随机产生一个元素importrandom#生成一个0到1的随机浮点数:0<=n<1.0print(random.random())>>

系统 2019-09-27 17:54:26 2069

Python

Python3操作Excel-以豆瓣图书Top250为例

本文利用Python3爬虫抓取豆瓣图书Top250,并利用xlwt模块将其存储至excel文件,图片下载到相应目录。旨在进行更多的爬虫实践练习以及模块学习。工具1.Python3.52.BeautifulSoup、xlwt模块开始动手首先查看目标网页的url:https://book.douban.com/top250?start=0,然后我尝试了在代码里直接通过字符串连接仅改变”start=“后面的数字的方法来遍历所有的250/25=10页内容,但是后来

系统 2019-09-27 17:53:39 2069

Python

python3实现mysql导出excel的方法

Mysql中'employee'表内容如下:#__Desc__=从数据库中导出数据到excel数据表中importxlwtimportpymysqlclassMYSQL:def__init__(self):passdef__del__(self):self._cursor.close()self._connect.close()defconnectDB(self):"""连接数据库:return:"""try:self._connect=pymysql.C

系统 2019-09-27 17:53:01 2069

Python

Python中的zip函数使用示例

zip函数接受任意多个(包括0个和1个)序列作为参数,返回一个tuple列表。具体意思不好用文字来表述,直接看示例:1.示例1:复制代码代码如下:x=[1,2,3]y=[4,5,6]z=[7,8,9]xyz=zip(x,y,z)printxyz运行的结果是:[(1,4,7),(2,5,8),(3,6,9)]从这个结果可以看出zip函数的基本运作方式。2.示例2:复制代码代码如下:x=[1,2,3]y=[4,5,6,7]xy=zip(x,y)printxy运

系统 2019-09-27 17:52:42 2069