搜索到与相关的文章
Python

Python字符串处理的8招秘籍(小结)

Python的字符串处理,在爬虫的数据解析、大数据的文本清洗,以及普通文件处理等方面应用非常广泛,而且Python对字符串的处理内置了很多高效的函数,功能非常强大、使用非常方便。今天我就把字符串处理时用到最多的方法总结分享给大家,希望大家可以轻松应对字符串处理。1.字符串的切片和相乘(1)切片str='Mondayisabusyday'print(str[0:7])#表示取第一个到第七个的字符串print(str[-3:])#表示取从倒数第三个字符开始到结

系统 2019-09-27 17:57:52 2242

Python

用python3 urllib破解有道翻译反爬虫机制详解

前言最近在学习python爬虫方面的知识,网上有一博客专栏专门写爬虫方面的,看到用urllib请求有道翻译接口获取翻译结果。发现接口变化很大,用md5加了密,于是自己开始破解。加上网上的其他文章找源码方式并不是通用的,所有重新写一篇记录下。爬取条件要实现爬取的目标,首先要知道它的地址,请求参数,请求头,响应结果。进行抓包分析打开有道翻译的链接:http://fanyi.youdao.com/。然后在按f12点击Network项。这时候就来到了网络监听窗口,

系统 2019-09-27 17:57:02 2242

Python

python获取点击的坐标画图形的方法

获取输入的五个点画五边形defpentagonUpdate():p={}win=GraphWin("Click",800,300)#后面两个值为窗体的长和宽foriinrange(5):p[i]=win.getMouse()p[i].draw(win)polygon=Polygon(p[0],p[1],p[2],p[3],p[4])polygon.setFill("peachpuff")polygon.setOutline("black")polygon.

系统 2019-09-27 17:57:01 2242

Python

python多进程——fork()

简介程序每次执行时,操作系统都会创建一个新进程来运行程序指令。进程中可调用os.fork,要求操作系统新建一个子进程.[Windowsc系统中,os模块没有os.fork函数]。每个进程都有一个不重复的进程ID号。或称pid,它对进程进行标识。子进程与父进程完全相同,子进程从父进程继承了多个值的拷贝。如全局变量和环境变量。fork后,子进程接收返回值0,而父进程接收子进程的pid作为返回值os.fork()Forkachildprocess.Return0

系统 2019-09-27 17:55:42 2242

Python

python输出带颜色字体实例方法

在python开发的过程中,经常会遇到需要打印各种信息。海量的信息堆砌在控制台中,就会导致信息都混在一起,降低了重要信息的可读性。这时候,如果能给重要的信息加上字体颜色,那么就会更加方便用户阅读了。当然了,控制台的展示效果有限,并不能像前段一样炫酷,只能做一些简单的设置。不过站在可读性的角度来看,已经好很多了。书写格式:开头部分:\033[显示方式;前景色;背景色m+结尾部分:\033[0m注意:开头部分的三个参数:显示方式,前景色,背景色是可选参数,可以

系统 2019-09-27 17:55:17 2242

Python

python操作cookie

(一)方法方法简单说明add_cookie(cookie_dict)在当前会话中添加cookie信息cookie_dict:字典,name和value是必须的delete_all_cookies()在当前会话中删除所有cookie信息delete_cookie(name)删除单个名为name的cookie信息get_cookie(name)返回单个名为name的cookie信息,如果没有找到,返回noneget_cookies()返回当前会话所有的cook

系统 2019-09-27 17:54:00 2242

Python

Python读取环境变量的方法和自定义类分享

使用os.environ来读取和修改环境变量:复制代码代码如下:importosprint(os.environ["TEMP"])mydir="c:\\mydir"os.environ["MYDIR"]=mydirprint(os.environ["MYDIR"])pathV=os.environ["PATH"]print(pathV)os.environ["PATH"]=mydir+";"+os.environ["PATH"]print(os.envir

系统 2019-09-27 17:54:00 2242

Python

python爬虫实战——爬取股票个股信息

爬虫爬取网页信息的思路:发送网页端请求—>获取响应内容—>解析内容—>获取想要的数据—>保存数据这次我们要实现的是爬取静态网页的股票数据,首先是获取沪深A股的所有股票代码,再用这些股票代码获取相应股票的信息东方财富网有所有个股的股票代码(沪深A股所有股票)查看其网页源代码在网页源代码中可以搜索到相应的元素,判断其是数据是静态的接下来是获取每只个股的信息,由于周六日没开市,东方财富网的个股信息没有显示这里改用百度股市通(个股)同样地检查元素可以发现个股的信息

系统 2019-09-27 17:52:55 2242

Python

Python网络爬虫——http和https协议

一.HTTP协议1.官方概念:HTTP协议是HyperTextTransferProtocol(超文本传输协议)的缩写,是用于从万维网(WWW:WorldWideWeb)服务器传输超文本到本地浏览器的传送协议。(虽然童鞋们将这条概念都看烂了,但是也没办法,毕竟这就是HTTP的权威官方的概念解释,要想彻底理解,请客观目移下侧......)2.白话概念:HTTP协议就是服务器(Server)和客户端(Client)之间进行数据交互(相互传输数据)的一种形式。我

系统 2019-09-27 17:52:22 2242

Python

python3.x上post发送json数据

一.摘要做接口自动化测试时,常常需要使用python发送一些json内容的接口报文,如果使用urlencode对内容进行编码解析并发送请求,会发现服务器返回了200,OK的状态,但响应内容不可读(像是一堆加密报文)。定位问题时发现抓包发现发送报文的内容与我们发送的json内容不符(会去掉”{“与”}“等内容),所以重新采用了json封装后,问题解决。二.解决方法1.先导入json模块,采用json.dumps将json内容进行封装eg:importjson

系统 2019-09-27 17:52:02 2242