一、前言以前使用selenium的无头浏览器,自从phantomjs2016后慢慢不更新了之后,selenium也开始找下家,这时候谷歌的chrome率先搞出来无头浏览器并开放了各种api,随后firefox也开始做。现在selenium的测试也都支持这两个浏览器的无头模式了,只需要在引入的时候配置一下就可以了。之所以要采用谷歌chrome官方无头框架puppeteer的python版本pyppeteer,是因为有些网页是可以检测到是否是使用了seleni
系统 2019-09-27 17:52:58 2298
前言大家都知道Python语言有两个特点,第一是它有Python2和Python3两个版本,第二是它是由很多独立的库堆叠起来了,大部分人学习Python都是从Python2开始的,但是由于Python2从2020年开始很多库就停止维护了,大部分互联网公司Python代码也开始从Python2往Python3迁移了,因此大部分开始同时使用Python2和Python3,Python的IDE比较多,常用的比如pychram,VScode等,本文主要介绍在pyc
系统 2019-09-27 17:52:53 2298
python读写csv文件并增加行列,具体代码如下所示:#-*-coding:utf-8-*-"""CreatedonThuAug1711:28:172017@author:ShawnYuen"""importcsvd=list(range(38685))withopen('./kinetics_test.csv')asf1:f_csv=csv.DictReader(f1)fori,rowinenumerate(f_csv):#print(row)key1
系统 2019-09-27 17:52:37 2298
之前用了谷歌的selenium模块,为了练习一下所以写了这个(没错才不是别的理由!)代码里涉及到了各种复杂的情况,包括要找的div在别的iframe中的处理方式,顶部导航栏的定位方式等等。综合性很强下面是代码fromseleniumimportwebdriverimporttimefromfake_useragentimportUserAgentopt=webdriver.ChromeOptions()#opt.add_argument('--headle
系统 2019-09-27 17:52:24 2298
字符串在Python中是最简单也是最常用的数据类型之一,在CPython中字符串的实现原理使用了一种叫做Intern(字符串驻留)的技术来提高字符串效率。究竟什么是intern机制,这种机制又是通过什么方式来提高字符串效率的呢?希望这篇文章能够抛砖引玉。先来看一段代码:>>>s3="hello!">>>s4="hello!">>>s3iss4False>>>id(s3)80325968L>>>id(s4)80326048Ls3和s4虽然值是一样的,但确确实
系统 2019-09-27 17:52:22 2298
前言:用python实时实现监控一个文件夹功能,将监控到的Excel(笔者目前用于解析excel文件)解析写到mysql中,起功能和sparkStreaming中的textFileStream功能,个人感觉python代码更好看。毕竟java代码看起来比较繁琐,scala代码简洁,可是它也是借鉴python发展而来啊。python实现看门狗功能代码:#!/usr/bin/python#-*-coding:UTF-8-*-importtimefromwatc
系统 2019-09-27 17:52:09 2298
Python正则表达式匹配数字电话号码:\d{3}-\d{8}|\d{4}-\d{7}QQ号:[1-9][0-9]{4,}中国邮政编码:[1-9]\d{5}(?!\d)身份证:\d{15}|\d{18}ip地址:\d+\.\d+\.\d+\.\d+[1-9]\d*正整数-[1-9]\d*负整数-?[1-9]\d*整数[1-9]\d*|0非负整数-[1-9]\d*|0非正整数[1-9]\d*\.\d*|0\.\d*[1-9]\d*$正浮点数-([1-9]\d
系统 2019-09-27 17:50:40 2298
这节主要介绍time,random模块;不用死记。首先说一下什么是模块。。。importtime有些朋友,开始比迷惑的,但是后面聊到类(属性,方法),包会好一点,我们这里没这么快说到,慢慢来,但是为了方便你记忆。。。最及简单的是.....你知道x.py是你写的python脚本;如果你在同一个目录下定义了另外一个time.py。你importtime就直接调用了(这也是,我们需要注意的,定义x.py时候名字不要跟自带的模块名字,第3方模块一样的名字,除非你自
系统 2019-09-27 17:50:00 2298
声明:本文所使用方法为老猿自行研究并编码,相关代码版权为老猿所有,禁止转载文章,代码禁止用于商业用途!在《第11.23节Python中re模块的搜索替换功能:sub及subn函数》介绍了re.sub函数,其中的替换内容可以是一个函数,利用该功能我们可以展示正则表达式匹配过程中匹配到的目标子串的匹配顺序、匹配文本的内容和匹配文本在搜索文本中的位置。具体实现如下:importrematchcount=0defparsematch(patstr,text):gl
系统 2019-09-27 17:48:49 2298
一、列表元素的追加和插入append():追加一个元素到列表extend():列表拉伸,追加多个元素到列表insert():在指定索引处插入元素二、列表元素的删除pop(a):弹出列表中索引为a的元素,默认为列表最后一个元素pop()弹出的值可用变量接收remove():删除列表元素del:从内存种删除一个元素三、列表元素的重新赋值1、通过索引,重新赋值2、通过切片赋值四、列表元素的排序x.sort()#列表排序,默认按照ascii排序x.sort(rev
系统 2019-09-27 17:48:02 2298