搜索到与相关的文章
Python

python爬虫解决验证码的思路及示例

如果直接从生成验证码的页面把验证码下载到本地后识别,再构造表单数据发送的话,会有一个验证码同步的问题,即请求了两次验证码,而识别出来的验证码并不是实际需要发送的验证码。有如下几种方法解决。法1:用session:mysession=requests.Session()login_url='http://xxx.com'checkcode_url='http://yyy.com'html=mysession.get(login_url,timeout=60*

系统 2019-09-27 17:52:42 1927

Python

Python爬虫图片懒加载技术 selenium和PhantomJS解析

一.什么是图片懒加载?-案例分析:抓取站长素材http://sc.chinaz.com/中的图片数据#!/usr/bin/envpython#-*-coding:utf-8-*-importrequestsfromlxmlimportetreeif__name__=="__main__":url='http://sc.chinaz.com/tupian/gudianmeinvtupian.html'headers={'User-Agent':'Mozill

系统 2019-09-27 17:52:42 1927

Python

教你如何用python操作Excel

python操作Excel首先我们先分析一下怎么去操作和流程使用哪些库及方式本文免费直播课程分享链接:https://ke.qq.com/course/397896?flowToken=1009460有需要学习提升的宝宝可以进去免费报名一下1、使用的库xlrd2、打开文件3、定位到具体的一个sheet表4、以什么方式打开分析完之后下面就是操作编写代码,注意看和分析#--coding:utf-8--importxlrd#打开一个文件data=xlrd.ope

系统 2019-09-27 17:52:40 1927

Python

Python Web Flask源码解读(四)——全局变量

关于我一个有思想的程序猿,终身学习实践者,目前在一个创业团队任teamlead,技术栈涉及Android、Python、Java和Go,这个也是我们团队的主要技术栈。Github:https://github.com/hylinux1024微信公众号:终身开发者(angrycode)Flask中全局变量有current_app、request、g和session。不过需要注意的是虽然标题是写着全局变量,但实际上这些变量都跟当前请求的上下文环境有关,下面一起

系统 2019-09-27 17:52:39 1927

Python

明天找python工作,看看这几道Python面试题吧,Python面试题

第1题:如何解决验证码的问题,用什么模块,听过哪些人工打码平台?PIL、pytesser、tesseract模块平台的话有:(打码平台特殊,不保证时效性)云打码挣码斐斐打码若快打码超级鹰第2题:ip被封了怎么解决,自己做过ip池么?关于ip可以通过ip代理池来解决问题ip代理池相关的可以在github上搜索ipproxy自己选一个去说https://github.com/awolfly9/IPProxyTool提供大体思路:获取器通过requests的爬虫

系统 2019-09-27 17:52:35 1927

Python

python连接PostgreSQL数据库的过程详解

1.常用模块#连接数据库connect()函数创建一个新的数据库连接对话并返回一个新的连接实例对象PG_CONF_123={'user':'emma','port':123,'host':'192.168.1.123','password':'emma','database':'dbname'}conn=psycopg2.connect(**PG_CONF_123)#打开一个操作整个数据库的光标连接对象可以创建光标用来执行SQL语句cur=conn.cur

系统 2019-09-27 17:52:21 1927

Python

python redis连接 有序集合去重的代码

pythonredis连接有序集合去重的代码如下所述:#-*-coding:utf-8-*-importredisfromconstantimportredis_ip,redis_db,redis_pw,redis_zset_namepool=redis.ConnectionPool(host=redis_ip,db=redis_db,password=redis_pw)#pool=redis.ConnectionPool(db=6,password=re

系统 2019-09-27 17:51:00 1927

Python

详解python分布式进程

在Thread和Process中,应当优选Process,因为Process更稳定,而且,Process可以分布到多台机器上,而Thread最多只能分布到同一台机器的多个CPU上。Python的multiprocessing模块不但支持多进程,其中managers子模块还支持把多进程分布到多台机器上。一个服务进程可以作为调度者,将任务分布到其他多个进程中,依靠网络通信。由于managers模块封装很好,不必了解网络通信的细节,就可以很容易地编写分布式多进程

系统 2019-09-27 17:50:30 1927

Python

python+openCV调用摄像头拍摄和处理图片的实现

在深度学习过程中想做手势识别相关应用,需要大量采集手势图片进行训练,作为一个懒人当然希望飞快的连续采集图片并且采集到的图片就已经被处理成统一格式的啦。。于是使用python+openCV调用摄像头,在采集图片的同时顺便处理成想要的格式。详细代码如下:importcv2importosprint("=============================================")print("=热键(请在摄像头的窗口使用):=")print("=

系统 2019-09-27 17:50:14 1927

Python

python相关的琐碎知识

python环境搭建常用的python环境管理工具:pyenv&&virtualenvpyenv#安装到~/.pyenv当中,如果使用了zsh,那么将.bashrc-->.zshrcgitclonehttps://github.com/pyenv/pyenv.git~/.pyenvecho'exportPYENV_ROOT="$HOME/.pyenv"'>>~/.bashrcecho'exportPATH="$PYENV_ROOT/bin:$PATH"'>

系统 2019-09-27 17:49:57 1927