【摘要】本节中,我们利用requests库和正则表达式来抓取猫眼电影TOP100的相关内容。requests比urllib使用更加方便,而且目前我们还没有系统学习HTML解析库,所以这里就选用正则表达式来作为解析工具。1.本节目标本节中,我们要提取出猫眼电影TOP100的电影名称、时间、评分、图片等信息,提取的站点URL为http://maoyan.com/board/4,提取的结果会以文件形式保存下来。2.准备工作在本节开始之前,请确保已经正确安装好了r
系统 2019-09-27 17:48:56 2088
第一篇基本概念01什么是数据结构02什么是算法03应用实例-最大子列和问题第二篇线性结构01线性表及其实现02堆栈03队列04应用实例-多项式加法运算05小白专场-多项式乘法与加法运算-c语言实现05小白专场-多项式乘法与加法运算-python语言实现第三篇树(上)01树与树的表示02二叉树及存储结构03二叉树的遍历04小白专场-树的同构-c语言实现04小白专场-树的同构-python语言实现第三篇树(中)01二叉搜索树02平衡二叉树03小白专场-是否同一
系统 2019-09-27 17:48:29 2088
python中,遍历dict的方法有四种。但这四种遍历的性能如何呢?我做了如下的测试l=[(x,x)forxinxrange(10000)]d=dict(l)fromtimeimportclockt0=clock()foriind:t=i+d[i]t1=clock()fork,vind.items():t=k+vt2=clock()fork,vind.iteritems():t=k+vt3=clock()fork,vinzip(d.iterkeys(),d
系统 2019-09-27 17:48:13 2088
本文介绍了使用Python来扫描指定目录下的文件,或者匹配指定后缀和前缀的函数。步骤如下:如果要扫描指定目录下的文件,包括子目录,需要调用scan_files("/export/home/test/")如果要扫描指定目录下的特定后缀的文件(比如jar包),包括子目录,调用scan_files("/export/home/test/",postfix=".jar")如果要扫描指定目录下的特定前缀的文件(比如test_xxx.py),包括子目录,调用scan_
系统 2019-09-27 17:47:27 2088
1、介绍itertools是python的迭代器模块,itertools提供的工具相当高效且节省内存。使用这些工具,你将能够创建自己定制的迭代器用于高效率的循环。-无限迭代器itertools包自带了三个可以无限迭代的迭代器。这意味着,当你使用他们时,你要知道要的到底是最终会停止的迭代器,还是需要无限地迭代鞋去。(1)count(初值=0,步长=1):count迭代器会返回从传入的起始参数开始的均匀间隔的数值。count也可以接收指定的步长参数。我们来看一
系统 2019-09-27 17:47:20 2088
你学习到今日,会发现python你基本都掌握了。可以完成基本的东西。。。。。突然有个问题,是为什么我还不能搞程序,完整实现一点东西(贵在坚持,入门就想吃大胖子,想太多了)另外一个问题,我们写出来简单的代码,本来一个很简单的内容,但是真正能用缺要debug很久。。。。(排查)bug###是昆虫,臭虫的意思,在计算机发展过程中,有一个故事,就是昆虫依附在电路板某个地方,导致无法开机。。。debug###就是驱虫,除虫的意思。(会网络的朋友,经常无奈的时候会de
系统 2019-09-27 17:47:06 2088
对Python中正则表达式的理解,主要就是对符号的理解,本文即对Python中常用的正则表达式符号进行简析。其主要的符号有:.默认匹配一个字符,不包含换行符,如果设置DOTALL则匹配换行符^匹配行首$匹配行尾*匹配0个或者多个重复+匹配一个或者多个重复?匹配一个或者零个重复*?,+?,??按照非贪婪模式匹配{m},{m,n},{m,n}?分别匹配m个重复,m至n个重复,m至n个重复按照非贪婪模式\转义[][abc],[a-z][^a-z]|或者匹配'a|
系统 2019-09-27 17:46:52 2088
importzipfileimporteasyguiasguifromthreadingimportThreaddefcrackPassword(zFile,password):try:zFile.extractall(pwd=password.encode("utf-8"))print("[+]crackpassword"+password)returnexcept(RuntimeError,zipfile.BadZipFile):print("密码:"
系统 2019-09-27 17:46:51 2088
今天想用python做个demo,含两个子图的动态gif,代码如下:importmatplotlib.pyplotaspltimportimageio,osimportmatplotlib#plt.ion()fig=plt.figure(0)ax1=plt.subplot(121)ax2=plt.subplot(122)ax1.set_title('input')ax2.set_title('GT')foriinrange(1000):img1=plt.i
系统 2019-09-27 17:46:22 2088
Python的MySQLdb模块是Python连接MySQL的一个模块,默认查询结果返回是tuple类型,只能通过0,1..等索引下标访问数据默认连接数据库:复制代码代码如下:MySQLdb.connect(host=host,user=user,passwd=passwd,db=db,port=port,charset='utf8')查询数据:复制代码代码如下:cur=conn.cursor()cur.execute('selectb_idfromblo
系统 2019-09-27 17:46:17 2088