之前用了谷歌的selenium模块,为了练习一下所以写了这个(没错才不是别的理由!)代码里涉及到了各种复杂的情况,包括要找的div在别的iframe中的处理方式,顶部导航栏的定位方式等等。综合性很强下面是代码fromseleniumimportwebdriverimporttimefromfake_useragentimportUserAgentopt=webdriver.ChromeOptions()#opt.add_argument('--headle
系统 2019-09-27 17:52:24 2153
1.基本概念turtle是“海龟”的意思,可以想象一只小海龟尾巴蘸着墨水在画图,屏幕坐标系坐标原点在左上角,用于设置窗口大小和位置;空间坐标系的坐标原点在窗口中央,分为四个象限,相当于画布turtle是标准库importturtle→turtle.forward()importturtleast→t.forward()fromturtleimportforward,backward→forward()fromturtleimport*→forward()2
系统 2019-09-27 17:51:33 2153
常见的反爬机制及处理方式1、Headers反爬虫:Cookie、Referer、User-Agent解决方案:通过F12获取headers,传给requests.get()方法2、IP限制:网站根据IP地址访问频率进行反爬,短时间内进制IP访问解决方案:1、构造自己IP代理池,每次访问随机选择代理,经常更新代理池2、购买开放代理或私密代理IP3、降低爬取的速度3、User-Agent限制:类似于IP限制解决方案:构造自己的User-Agent池,每次访问随
系统 2019-09-27 17:51:32 2153
前言其实有一个模块也支持执行系统命令,那个模块就是sys.system,但他执行系统命令会直接通过主进程去执行命令,那假如,该命令的执行需要耗费一个小时,那么主进程会卡一个小时,而不会去干别的事,这样就会导致程序的运行效率低下。如果由subprocess去执行系统命令的时候并不会让主进程去执行,而是主进程会开辟出一个子进程去执行,并不会影响到主进程的运行,主进程该干嘛就干嘛,那么又有个问题,大家都知道进程之间的内存空间是独立的,也就是说进程之间是不能相互访
系统 2019-09-27 17:50:09 2153
PythonORM概览作为一个美妙的语言,Python除了SQLAlchemy外还有很多ORM库。在这篇文章里,我们将来看看几个流行的可选ORM库,以此更好地窥探到PythonORM境况。通过写一段脚本来读写2个表,person和address到一个简单的数据库,我们能更好地理解每个ORM库的优缺点。SQLObjectSQLObject是一个介于SQL数据库和Python之间映射对象的PythonORM。得益于其类似于RubyonRails的ActiveR
系统 2019-09-27 17:49:05 2153
python编程中常用的12种基础知识总结:正则表达式替换,遍历目录方法,列表按列排序、去重,字典排序,字典、列表、字符串互转,时间对象操作,命令行参数解析(getopt),print格式化输出,进制转换,Python调用系统命令或者脚本,Python读写文件。1、正则表达式替换目标:将字符串line中的overview.gif替换成其他字符串复制代码代码如下:>>>line=''>>>mo=re.compile(r'(?<=SRC=)"([\w+\.]+
系统 2019-09-27 17:47:40 2153
Python作为本学期新学的一门语言,和以前学的C,Java有着很大的不同,不仅环境安装简单,它的语言用法更加的简单,也更加的随意。Pycharm的使用因为有引申输入的存在,也更加方便快捷,jupyternotebook的使用有着保存历史的程序功能,也很方便,不仅可以当课件也可以看以前写过的代码,方便我们的学习和复习。通过python的学习,也养成了缩进的习惯,这样可以不仅能让python的语法正确,也可以使程序看起来更加的美观整洁。边讲边练的形式和以前上
系统 2019-09-27 17:47:01 2153
变量从作用域分类作用范围从小到大为,小作用域的可以调用大作用域的内容。局部Local闭包Enclosing全局Global内建Build-in局部变量局部变量是定义在函数中的,因此其作用域是在函数内部。defexample():v=1#局部变量print(v)由于局部变量作用域只在函数内部有效,因此程序会报错Traceback(mostrecentcalllast):File"test.py",line3,inprint(v)NameErr
系统 2019-09-27 17:46:36 2153
前言在iOS项目开发的过程中,如果版本迭代开发的时间比较长,那么在很多版本开发以后或者说有多人开发参与以后,工程中难免有一些垃圾资源,未被使用却占据着api包的大小!这里我通过Python脚本来查找项目中未被使用的图片、音频、视频资源,然后删除掉;以达到减小APP包大小的目的!代码先查找项目中所以的资源文件存到你数组里面defsearchAllResName(file_dir):global_resNameMapfs=os.listdir(file_dir
系统 2019-09-27 17:45:52 2153
妹子图网站爬取---前言从今天开始就要撸起袖子,直接写Python爬虫了,学习语言最好的办法就是有目的的进行,所以,接下来我将用10+篇的博客,写爬图片这一件事情。希望可以做好。为了写好爬虫,我们需要准备一个火狐浏览器,还需要准备抓包工具,抓包工具,我使用的是CentOS自带的tcpdump,加上wireshark,这两款软件的安装和使用,建议你还是学习一下,后面我们应该会用到。妹子图网站爬取---网络请求模块requests妹子图网站爬取---安装req
系统 2019-09-27 17:45:42 2153
百度贴吧爬虫之获取邮箱系列之增强版,应该是任意邮箱了功能:获取文本中的邮箱上个基础版支持的不大好,对有些邮箱不支持,还有些其他问题读文本,且获取文本中的各种电子邮箱对获得的邮箱去重每个邮箱独占一行写入新的文件#coding:utf-8"""Name:email.pyAuthor:GSContect:2903344135@qq.comTime:2019/7/820:23Desc:"""importref=open('test.txt','r',encodin
系统 2019-09-27 17:57:15 2152
pythonFilterPython中的内置函数filter()主要用于过滤序列。和map类似,filter()也接收一个函数和序列,和map()不同的是,filter()把传入的函数依次作用于每个元素,然后根据返回值是True还是False决定保留还是丢弃该元素。例1:number_list=range(-5,5)less_than_zero=list(filter(lambdax:x<0,number_list))print(less_than_zer
系统 2019-09-27 17:56:56 2152
input函数,在用户直接使用回车的情况下到底保存了个什么?实验如下:i=input("直接录入回车,i保存的是个啥?")print(i)print(type(i))ifi=="":print("匹配成功,保存的是空字符串!")执行之后,确认,在直接回车的情况下,input函数保存的是空字符串
系统 2019-09-27 17:56:10 2152
本文实例讲述了python中二维阵列的变换方法。分享给大家供大家参考。具体方法如下:先看如下代码:arr=[[1,2,3],[4,5,6],[7,8,9],[10,11,12]]printmap(list,zip(*arr))print'_-------------------------------------------------'print[[r[col]forrinarr]forcolinrange(len(arr[0]))]运行结果如下:[[1
系统 2019-09-27 17:55:35 2152
读取文件,将每一行作为列表的一个值,求每个字符串出现的次数,以及有哪些字符串。写入文件,按次数大小排序,次数后面对应着字符串#-*-coding:utf-8-*-input1=open('jpc.txt','r')output1=open('out.txt','w')list_of_all_the_lines=input1.read()a=list_of_all_the_lines.splitlines(False)myset=set(a)mylist_c
系统 2019-09-27 17:55:24 2152