搜索到与相关的文章
Python

Python如何爬取微信公众号文章和评论(基于 Fiddler 抓包分析)

背景说明感觉微信公众号算得是比较难爬的平台之一,不过一番折腾之后还是小有收获的。没有用Scrapy(估计爬太快也有反爬限制),但后面会开始整理写一些实战出来。简单介绍下本次的开发环境:python3requestspsycopg2(操作postgres数据库)抓包分析本次实战对抓取的公众号没有限制,但不同公众号每次抓取之前都要进行分析。打开Fiddler,将手机配置好相关代理,为避免干扰过多,这里给Fiddler加个过滤规则,只需要指定微信域名mp.wei

系统 2019-09-27 17:53:47 2067

Python

第11.15节 Python正则表达式转义符定义的特殊序列

一、引言在前面《第11.13节Python正则表达式的转义符”\”功能介绍》介绍了正则表达式转义符'\',只不过当时作为转义符主要是用于在正则表达式中表示元字符自身的需要进行的转义。实际上,除了元字符使用转义符外,Python还支持由'\'和一个ASCII数字或ASCII字母字符组成的特殊序列,这些特殊代表特殊的含义。如果'\'后面跟的字符不是ASCII数字或者ASCII字母,那么正则样式将直接匹配后面跟的字符,如’\$’匹配字符‘$’。二、特殊序列\nu

系统 2019-09-27 17:53:29 2067

Python

Python跨文件全局变量的实现方法示例

前言在C语言中,由于变量一定是先声明,后使用,所以我们可以清楚的知道,现在使用的变量是全局还是局部,比如:inta=5;voidtest(void){a=1;//没有先声明,所以用的是全局的变量a}voidtest1(void){inta;a=2;//前面声明了,所以用的是局部变量a,对其所做的修改不会影响全局变量a}voidmain(void){printf("before:a=%d\n",a);test();printf("aftertest:a=%d

系统 2019-09-27 17:53:03 2067

Python

Python+matplotlib实现华丽的文本框演示代码

华丽的文本框演示首先看看演示结果:实现代码importmatplotlib.pyplotaspltplt.text(0.8,0.5,"python",size=50,rotation=30.,ha="center",va="center",bbox=dict(boxstyle="round",ec=(1.,0.5,0.5),fc=(1.,0.8,0.8),))plt.text(0.75,0.6,"www.jb51.net",size=50,rotation

系统 2019-09-27 17:52:30 2067

Python

Python操作CouchDB数据库简单示例

安装pythoncouchDb库:https://pypi.python.org/pypi/CouchDB/0.10连接服务器复制代码代码如下:>>>importcouchdb>>>couch=couchdb.Server('http://example.com:5984/')创建数据库复制代码代码如下:>>>db=couch.create('test')#新建数据库>>>db=couch['mydb']#使用已经存在的数据库创建文档并插入到数据库:复制代

系统 2019-09-27 17:51:49 2067

Python

详解用Python练习画个美队盾牌

0环境Python版本:3.6.6操作系统:MacOSMojave10.14.21引言最近我媳妇每天晚上吃饭时候也拿手机看,上厕所也在看。看着看着还会笑?WTF?你在干嘛呢?没错,她在看美队……这男人比我帅?……比我有钱?……还是比我有腔调?……答案很明显,我相信你们的眼睛都是雪亮的。那问题来了,作为一个男人,怎么能忍?虽然是个明星,虽然是假的,虽然已经挽回不了败局了……那我就送个美队的盾牌给你吧……这篇文章不是Turtle的入门篇,所以关于基本的画笔使用

系统 2019-09-27 17:49:37 2067

Python

Python web框架:flask路由系统

1.可传入参数:@app.route('/user/')#常用的不加参数的时候默认是字符串形式的@app.route('/post/')#常用的#指定int,说明是整型的@app.route('/post/')@app.route('/post/')@app.route('/login',methods=['GET','POST'])DEFAULT_CONVERTERS={'default':UnicodeConverter,'string':Unicod

系统 2019-09-27 17:49:32 2067

Python

Python 50行爬虫抓取并处理图灵书目过程详解

前言使用requests进行爬取、BeautifulSoup进行数据提取。主要分成两步:第一步是解析图书列表页,并解析出里面的图书详情页链接。第二步是解析图书详情页,提取出感兴趣的内容,本例中根据不同的数据情况,采用了不同的提取方法,总的感觉就是BeautifulSoup用起来很方便以下是几个典型HTML内容提取的Python代码片段1、提取详情页链接列表页中的详情页链接片段深度学习入门:基于Python的理论与实现提取详情页链接的Python代码#bs是

系统 2019-09-27 17:49:25 2067

Python

python爬虫正则表达式爬妹子图

声明:仅为了学习爬虫,请勿用于商业和恶意爬取数据,否则后果自负,作者享有该文章的所有解释权原创文章:只需要在程序运行时输入一个数字,就会爬取1-该页数的图片,并且爬取小图对应的详情大图(套图),代码复制可用,下面是我爬取的部分数据。小图太过性感,这里就不截图了importrequestsimportreimportosheaders={"User-Agent":"Mozilla/5.0(WindowsNT6.1;WOW64)AppleWebKit/537.

系统 2019-09-27 17:48:57 2067

Python

Python中lambda函数用法

1、先来看一个函数:defsum(x,y):returnx+y用lambda来实现:p=lambdax,y:x+yprint(p(1,2))2、传入一个参数的lambda函数a=lambdax:x*xprint(a(2))#注意:这里直接a(2)可以执行,但没有输出的,因为没有print3、多个参数的lambda形式:a=lambdax,y,z:x*y*zprint(a(5,6,7))匿名函数lambda:是指一类无需定义标识符(函数名)的函数或子程序。l

系统 2019-09-27 17:48:43 2067