【摘要】本节中,我们利用requests库和正则表达式来抓取猫眼电影TOP100的相关内容。requests比urllib使用更加方便,而且目前我们还没有系统学习HTML解析库,所以这里就选用正则表达式来作为解析工具。1.本节目标本节中,我们要提取出猫眼电影TOP100的电影名称、时间、评分、图片等信息,提取的站点URL为http://maoyan.com/board/4,提取的结果会以文件形式保存下来。2.准备工作在本节开始之前,请确保已经正确安装好了r
系统 2019-09-27 17:48:56 2022
首先,你得安装itchat,命令为pipinstallitchat,其余的较为简单,我不再说明,直接看注释吧。以下的代码我在Win7+Python3.7里面调试通过__author__='YueQingxuan'#-*-coding:utf-8-*-importitchat#hotReload=True可不用每次都去扫描二维码,只需要手机上确认下itchat.auto_login(hotReload=True)#获取好友列表friends=itchat.g
系统 2019-09-27 17:48:55 2022
前言R:代表redis-cliP:代表python的redis准备pipinstallredispool=redis.ConnectionPool(host='39.107.86.223',port=6379,db=1)redis=redis.Redis(connection_pool=pool)redis.所有命令下面命令所有命令我都省略了,有和Python内置函数冲突的我会加上redis.全局命令dbsize(返回key的数量)R:dbsizeP:pr
系统 2019-09-27 17:48:51 2022
通常来说,Python的变量/数据类型非常多,但是它是不需要用户指定的,因为有些是根据部份系统函数生成,另外一些是自动根据变量的值识别的,这些数据类型常量在classtypes定义,所以使用时需要importtypes如:复制代码代码如下:importtypesa=[1,2,3]iftype(a)istypes.ListType:printaelse:print'notlist'Python的具体变量/数据类型如下:NoneTypeNone类型TypeTy
系统 2019-09-27 17:48:24 2022
最近敲代码的时候主要遇到两大问题,第一个是构造自己包的时候找不到package。构造自己package谈两条经验,有助于解决这个问题。1自己构造包的名称尽量不要和Python自带的包重名,起的名字个性化一点。要不然出的bug都不知道错在哪2只要打算把这个文件夹当成一个包,就一定要在这个文件夹同一目录下新建一个__init__.py文件(内容可以为空)一般来说注意这两点,构建包就不成问题。在包的文件夹里面的.py文件称之为模块(文件名就是模块名),当然包里也
系统 2019-09-27 17:48:06 2022
问题:pyqt5下开发的时候,遇到了一个这样的问题。Traceback(mostrecentcalllast):File“test.py”,line3,infromPyQt5.QtWebEngineWidgetsimport*ImportError:dlopen(/Users/caoyin/anaconda3/lib/python3.7/site-packages/PyQt5/QtWebEngineWidgets.so,2):Librarynotloade
系统 2019-09-27 17:47:52 2022
首先还是应该科普下函数参数传递机制,传值和传引用是什么意思?函数参数传递机制问题在本质上是调用函数(过程)和被调用函数(过程)在调用发生时进行通信的方法问题。基本的参数传递机制有两种:值传递和引用传递。值传递(passl-by-value)过程中,被调函数的形式参数作为被调函数的局部变量处理,即在堆栈中开辟了内存空间以存放由主调函数放进来的实参的值,从而成为了实参的一个副本。值传递的特点是被调函数对形式参数的任何操作都是作为局部变量进行,不会影响主调函数的
系统 2019-09-27 17:47:11 2022
rstrip()方法返回所有字符都被去除的字符串(缺省为空格字符)结束字符串的副本。语法以下是rstrip()方法的语法:str.rstrip([chars])参数chars--可以提供要去除的字符。返回值此方法返回的所有字符都被去除的字符串(缺省为空格字符)结束字符串的副本。例子下面的例子显示了rstrip()方法的使用。#!/usr/bin/pythonstr="thisisstringexample....wow!!!";printstr.rstri
系统 2019-09-27 17:47:08 2022
你学习到今日,会发现python你基本都掌握了。可以完成基本的东西。。。。。突然有个问题,是为什么我还不能搞程序,完整实现一点东西(贵在坚持,入门就想吃大胖子,想太多了)另外一个问题,我们写出来简单的代码,本来一个很简单的内容,但是真正能用缺要debug很久。。。。(排查)bug###是昆虫,臭虫的意思,在计算机发展过程中,有一个故事,就是昆虫依附在电路板某个地方,导致无法开机。。。debug###就是驱虫,除虫的意思。(会网络的朋友,经常无奈的时候会de
系统 2019-09-27 17:47:06 2022
上面的博客把基本的HTML解析库已经说完了,这次我们来给予几个实战的项目。这次主要用Requests库+正则表达式来解析HTML。项目一:爬取猫眼电影TOP100信息代码地址:https://gitee.com/dwyui/maoyan-Requests.git项目二:美食爬取(包含多层爬取)代码地址:https://gitee.com/dwyui/meishi_Requests.git
系统 2019-09-27 17:47:06 2022