搜索到与相关的文章
Python

Python如何爬取微信公众号文章和评论(基于 Fiddler 抓包分析)

背景说明感觉微信公众号算得是比较难爬的平台之一,不过一番折腾之后还是小有收获的。没有用Scrapy(估计爬太快也有反爬限制),但后面会开始整理写一些实战出来。简单介绍下本次的开发环境:python3requestspsycopg2(操作postgres数据库)抓包分析本次实战对抓取的公众号没有限制,但不同公众号每次抓取之前都要进行分析。打开Fiddler,将手机配置好相关代理,为避免干扰过多,这里给Fiddler加个过滤规则,只需要指定微信域名mp.wei

系统 2019-09-27 17:53:47 2176

Python

Python 中運算子 + 與 * 的 Overload 方法重載功能

字串String原本不能像數值一樣有加減乘除運算,但有例外。例如:>>>'Good'+'Morning''GoodMorning'運算子+可將2個字串,串接起來。運算子+有字串Concat功能。同樣,運算子*有迭代Iterator的功能,例如:>>>'Good'*3'GoodGoodGood'這寫法讓Python的程式更簡潔易讀。例如:forkinrange(1,6):print(''*(6-k)+'A'*2*k)這樣簡潔幾行程式即能將此圖形畫出,不是很美

系统 2019-09-27 17:52:44 2176

Python

Python第五次作业

#读入文件pmi_days.csv,完成以下操作:1.统计质量等级对应的天数,例如:优:5天良:3天中度污染:2天2.找出PMI2.5的最大值和最小值,分别指出是哪一天。importpandasaspdimportcsvdays_path=open(r"C:\Users\Administrator\Desktop\pmi_days.csv")days_df=pd.read_csv(days_path)data=days_df.groupby('质量等级')

系统 2019-09-27 17:50:41 2176

Python

python关于豆瓣图书决策树构建

Matplotlib绘制决策树代码:#coding=utf-8importmatplotlib.pyplotasplt'''遇到不懂的问题?Python学习交流群:821460695满足你的需求,资料都已经上传群文件,可以自行下载!'''decisionNode=dict(boxstyle='sawtooth',fc='10')leafNode=dict(boxstyle='round4',fc='0.8')arrow_args=dict(arrowsty

系统 2019-09-27 17:50:28 2176

Python

Python制作微信好友背景墙教程(附完整代码)

引言前段时间,微信朋友圈开始出现了一种晒照片新形式,微信好友墙,即在一张大图片中展示出自己的所有微信好友的头像。效果如下图,出于隐私考虑,这里作了模糊处理。是不是很炫,而且这还是独一无二的,毕竟每个人的微信好友是不一样的。本文就教大家用Python来实现这种效果。环境操作系统:WindowsPython版本:3.7.3代码实现我们需要首先需要获取好友的头像信息,接下来处理图像并完成图像的拼接。准备工作在这里,我们登录微信获取好友信息,使用的是wxpy模块;

系统 2019-09-27 17:50:08 2176

Python

Python中使用copy模块实现列表(list)拷贝

引用是指保存的值为对象的地址。在Python语言中,一个变量保存的值除了基本类型保存的是值外,其它都是引用,因此对于它们的使用就需要小心一些。下面举个例子:问题描述:已知一个列表,求生成一个新的列表,列表元素是原列表的复制复制代码代码如下:a=[1,2]b=a这种做法其实并未真正生成一个新的列表,b指向的仍然是a所指向的对象。这样,如果对a或b的元素进行修改,a,b的值同时发生变化。解决的方法为:复制代码代码如下:a=[1,2]b=a[:]这样修改a对b没

系统 2019-09-27 17:49:48 2176

Python

python阿里巴巴招聘网站爬虫

写了个阿里巴巴招聘网站爬虫,这次是存在csv文件里,小伙伴们可以对比一下~importrequests,json,csv#写入csv文件中list=[]csv_file=open('阿里巴巴招聘.csv','w+',newline='',encoding='utf=8')writer=csv.writer(csv_file)list_head=['职位名称','部门','是否招聘','学历','大类','小类','工作地','工作经历','要求','职责'

系统 2019-09-27 17:49:31 2176

Python

Python从小白到攻城狮(3)——列表和元组

Python内置了多种类型的数据结构,常用的有:列表、元组、集合和字典。本文主要介绍列表和元组。列表(list)和元组(tuple)定义列表和元组,都是一个可以放置任意数据类型的有序集合。列表和元组的区别列表是动态的,长度大小不固定,可以随意增加、删减或者改变元素(mutable)。元组是静态的,长度大小固定,无法增加删减或改变(immutable)。如果要对已有的元组做任何“改变”,只能重新开辟一块内存,创建新的元组。#列表(list)list=[1,2

系统 2019-09-27 17:47:55 2176

Python

Python模块搜索概念介绍及模块安装方法介绍

【import模块】和C中的#include不同,Python中的import语句并不是简单的把一个文件插入另外一个文件。导入其实是运行时的运算,程序第一次导入指定文件时,会执行以下步骤,1.找到模块文件2.编译成位码3.执行模块中的代码来创建所定义的模块并生成.pyc字节码文件,这三个步骤只在程序执行时,模块第一次导入时会进行。之后导入相同的模块时,会跳过这三个步骤,而只提取内存中已加载的模块对象,速度要快的多。NOTE:1.Python把已加载的模块放

系统 2019-09-27 17:45:52 2176

Python

基于Selenium+Python的web自动化测试框架

一、什么是Selenium?Selenium是一个基于浏览器的自动化测试工具,它提供了一种跨平台、跨浏览器的端到端的web自动化解决方案。Selenium主要包括三部分:SeleniumIDE、SeleniumWebDriver和SeleniumGrid。SeleniumIDE:Firefox的一个扩展,它可以进行录制回放,并把录制的操作以多种语言(例如java、python等)的形式导出成测试用例。SeleniumWebDriver:提供Web自动化所需

系统 2019-09-27 17:45:45 2176