- 军军小站|张军博客
搜索到与相关的文章
Python

【Python3网络爬虫开发实战】3.4-抓取猫眼电影排行

【摘要】本节中,我们利用requests库和正则表达式来抓取猫眼电影TOP100的相关内容。requests比urllib使用更加方便,而且目前我们还没有系统学习HTML解析库,所以这里就选用正则表达式来作为解析工具。1.本节目标本节中,我们要提取出猫眼电影TOP100的电影名称、时间、评分、图片等信息,提取的站点URL为http://maoyan.com/board/4,提取的结果会以文件形式保存下来。2.准备工作在本节开始之前,请确保已经正确安装好了r

系统 2019-09-27 17:48:56 1868

Python

使用python分析统计自己微信朋友的信息

首先,你得安装itchat,命令为pipinstallitchat,其余的较为简单,我不再说明,直接看注释吧。以下的代码我在Win7+Python3.7里面调试通过__author__='YueQingxuan'#-*-coding:utf-8-*-importitchat#hotReload=True可不用每次都去扫描二维码,只需要手机上确认下itchat.auto_login(hotReload=True)#获取好友列表friends=itchat.g

系统 2019-09-27 17:48:55 1868

Python

利用Python实现简单的相似图片搜索的教程

大概五年前吧,我那时还在为一家约会网站做开发工作。他们是早期创业公司,但他们也开始拥有了一些稳定用户量。不像其他约会网站,这家公司向来以洁身自好为主要市场形象。它不是一个供你鬼混的网站――是让你能找到忠实伴侣的地方。由于投入了数以百万计的风险资本(在US大萧条之前),他们关于真爱并找寻灵魂伴侣的在线广告势如破竹。Forbes(福布斯,美国著名财经杂志)采访了他们。全国性电视节目也对他们进行了专访。早期的成功促成了事业起步时让人垂涎的指数级增长现象――他们的

系统 2019-09-27 17:48:46 1868

Python

Python3.x版本中新的字符串格式化方法

我们知道Python3.x引入了新的字符串格式化语法。不同于Python2.x的复制代码代码如下:"%s%s"%(a,b)Python3.x是复制代码代码如下:"{0}{1}".format(a,b)今天我在用MySQLdb时,需要用带参数的复制代码代码如下:cursor.execute(sql,param)语句来完成SQL操作。被其他文章的陈旧说法给误导,用了复制代码代码如下:cursor.execute('insertintotestvalues(%s

系统 2019-09-27 17:48:45 1868

Python

浅谈Python3 numpy.ptp()最大值与最小值的差

numpy.ptp()是计算最大值与最小值差的函数,用法如下:importnumpyasnpa=np.array([np.random.randint(0,20,5),np.random.randint(0,20,5)])print('原始数据\n'a)print('对所有数据计算\n',a.ptp())print('axis=0,按行方向计算,即每列\n',a.ptp(axis=0))#按行方向计算,即每列print('axis=1,按列方向计算,即每行

系统 2019-09-27 17:48:43 1868

Python

Python 迭代器与生成器实例详解

Python迭代器与生成器实例详解一、如何实现可迭代对象和迭代器对象1.由可迭代对象得到迭代器对象例如l就是可迭代对象,iter(l)是迭代器对象In[1]:l=[1,2,3,4]In[2]:l.__iter__Out[2]:In[3]:t=iter(l)In[4]:t.next()Out[4]:1In[5]:t.next()Out[5]:2In[6]:t.next()Out[6]:3In[7]:t.next()Out[7]:4In[8]:t.next()

系统 2019-09-27 17:48:18 1868

Python

python爬虫学习之爬取某图片网站

0x00:使用xpath进行网页解析#coding:utf-8importrequestsimportosimportrefromlxmlimportetreeimporttimedefget_title(title):#获取标题,创建文件path=r"./Pic/"+titleifos.path.exists(path):#文件夹存在,返回returnpathelse:os.makedirs(path)#创建空文件夹returnpathdefpic_ge

系统 2019-09-27 17:48:14 1868

Python

Python解析命令行读取参数--argparse模块使用方法

在多个文件或者不同语言协同的项目中,python脚本经常需要从命令行直接读取参数。万能的python就自带了argprase包使得这一工作变得简单而规范。PS:optparse包是类似的功能,只不过写起来更麻烦一些。如果脚本很简单或临时使用,没有多个复杂的参数选项,可以直接利用sys.argv将脚本后的参数依次读取(读进来的默认是字符串格式)。比如如下名为test.py的脚本:importsysprint"Inputargumentis%s"%(sys.a

系统 2019-09-27 17:48:12 1868

Python

python 中的列表生成式、生成器表达式、模块导入

5.16列表生成式l=[]foriinrange(100):l.append('egg%s'%i)print(l)​l=['egg%s'%iforiinrange(100)]l=['egg%s'%iforiinrange(1000)ifi>10]print(l)5.17列表生成式与生成器表达式的应用names=['egon','alex_sb','wupeiqi','yuanhao','lxx']res=map(lambdax:x.upper(),name

系统 2019-09-27 17:48:05 1868

Python

linux系统centos7超简单方便 安装python3.*

#安装依赖yum-ygroupinstalldevelopmentyum-yinstallzlib-devel#安装编译工具(也可以用yum或apt-get)aptitude-yinstallgccmakezliblg-dev下载安装包点我https://www.python.org/ftp/python/查找自己想要的版本#下载python安装包wgethttps://www.python.org/ftp/python/3.6.0/Python-3.6.

系统 2019-09-27 17:48:00 1868