初识pythonpython爬虫爬虫步骤(个人学习后的理解):获取URL地址解析URL源码提取源码中的需要信息使用re、beautifulsoup、urllib.request等常用库写入txt、excel等等。Python格式化字符:format_string%string_to_convert其中:format_string为格式标记字符串,形式为“%cdoe”;string_to_convert为要格式化的字符串,如果是两个以上,则需要用小括号括起来
系统 2019-09-27 17:49:59 2156
1、类变量、实例变量概念类变量:类变量就是定义在类中,但是在函数体之外的变量。通常不使用self.变量名赋值的变量。类变量通常不作为类的实例变量的,类变量对于所有实例化的对象中是公用的。实例变量:实例变量是定义在方法中的变量,使用self绑定到实例上的变量,只是对当前实例起作用。2、访问类变量在类的内部和外部类变量都可以直接使用className.类变量的形式访问。但是在类的内部,也可以使用self.类变量来访问,但是这个是用含义就不同了(后面使用代码验证
系统 2019-09-27 17:49:16 2156
在python代码中可以看到一些常见的trick,在这里做一个简单的小结。json字符串格式化在开发web应用的时候经常会用到json字符串,但是一段比较长的json字符串是可读性较差的,不容易看出来里面结构的。这时候就可以用python来把json字符串漂亮的打印出来。root@Exp-1:/tmp#catjson.txt{"menu":{"breakfast":{"EnglishMuffin":{"price":7.5},"BreadBasket":{
系统 2019-09-27 17:47:56 2156
本篇文章介绍的内容会涉及到以下知识:PyQt5的使用;Selenium的使用;代理服务器的架设和使用;一、账号限制之痛在如今的互联网中,免费的信息和资源占据了很大一部分,各类互联网应用提供了各行各业的资讯和资源。这是互联网能够不断繁荣和扩大的重要原因之一。与此同时,一些收费或不公开的互联网应用则构成了互联网世界中更有价值和意义的部分。一些限制性较低的网站,可能仅仅需要进行用户登录即可使用服务;一些限制性中等的网站,则可能会出于账户安全或是其他方面的因素考虑
系统 2019-09-27 17:47:34 2156
clock()方法返回当前的处理器时间,以秒表示Unix上一个浮点数。精度取决于具有相同名称的C函数,但在任何情况下,这是使用于基准Python或定时的算法函数。在Windows中该函数返回,因为这个函数的第一个调用过去挂钟秒钟,作为浮点数,基于Win32函数QueryPerformanceCounter。语法以下是clock()方法的语法:time.clock()参数NA返回值此方法返回当前处理器时间作为浮点数在UNIX秒钟,并在Windows中表示返回
系统 2019-09-27 17:46:43 2156
#!/usr/bin/python#-*-coding:utf-8-*-fromemail.mime.textimportMIMETextfromemail.headerimportHeaderfromsmtplibimportSMTP_SSLimportsyssmtpaddr='smtp.qq.com'myemail='admin@qq.com'password='123456'recvmail=sys.argv[1]subject=sys.argv[2
系统 2019-09-27 17:46:16 2156
一、什么是Selenium?Selenium是一个基于浏览器的自动化测试工具,它提供了一种跨平台、跨浏览器的端到端的web自动化解决方案。Selenium主要包括三部分:SeleniumIDE、SeleniumWebDriver和SeleniumGrid。SeleniumIDE:Firefox的一个扩展,它可以进行录制回放,并把录制的操作以多种语言(例如java、python等)的形式导出成测试用例。SeleniumWebDriver:提供Web自动化所需
系统 2019-09-27 17:45:45 2156
在平时的工程中,我们在构建工程时,常常需要用到配置文件,用来配置项目的一些信息,比如数据库,请求网址,文件夹,线程、进程数等信息,这样就可以方便我们通过修改配置文件中的参数来很好地完成整个项目的功能修改或开发。配置文件一般区别于Python代码,会单独存放在一个文件夹中,方便管理,常见的配置文件格式有.conf,.ini,.yaml等。本文使用Python中的configparser模块来处理conf、ini配置文件。首先需要安装configparser模
系统 2019-09-27 17:45:29 2156
Python数字数字数据类型用于存储数值。他们是不可改变的数据类型,这意味着改变数字数据类型会分配一个新的对象。当你指定一个值时,Number对象就会被创建:var1=1var2=10您也可以使用del语句删除一些对象引用。del语句的语法是:delvar1[,var2[,var3[....,varN]]]]您可以通过使用del语句删除单个或多个对象。例如:delvardelvar_a,var_bPython支持四种不同的数值类型:int(有符号整型)lo
系统 2019-09-27 17:38:45 2156
说明:python的urllib2获取网页(urlopen)会自动重定向(301,302)。但是,有时候我们需要获取302,301页面的状态信息。就必须获取到转向前的调试信息。下面代码将可以做到避免302重定向到新的网页#!/usr/bin/python#-*-coding:utf-8-*-#encoding=utf-8#Filename:states_code.pyimporturllib2classRedirctHandler(urllib2.HTTP
系统 2019-09-27 17:38:42 2156