搜索到与相关的文章
Python

30行python代码爬取历年双色球

当年学爬虫的第一个想法就是想把双色球的数据爬下来,然后看能不能用什么牛叉的算法,或者数据分析把后面的双色球概率算出来;知道现在才抽空写了这几行代码爬取了双色球的数据,我也真是够懒的;也算是闲来无事,练手的爬虫吧;好了,多余的就不说了,直接上代码吧,代码注释已经很清楚了;importsysimportrequestsfromlxmlimportetreedefget_url(url):#请求url的方法,返回htmlheaders={'User-Agent'

系统 2019-09-27 17:47:57 1919

Python

第10课 python 函数

今日有点晚,上午去hilston开会广东省科学院&白俄罗斯科学院所长会议。。。学习了一个上午,简直收获良多。。下午又多问题处理。。。。网站又聚餐。。只能回来加加班处理一下今日的内容了(不坚持,又被遗忘了),还是要坚持一下学习Python,不然真是忘记忘记再忘记,之后就不搞了。。。今日我们说函数:1.函数从小学-初中经常说的x=y+1,x,y都是有因果关系的,我们叫函数。今日我们在编程说的函数有区别的。他是一个代码的报装,当然也有因果关系。你执行/调用有相关

系统 2019-09-27 17:47:56 1919

Python

Python中__init__和__new__的区别详解

__init__方法是什么?使用Python写过面向对象的代码的同学,可能对__init__方法已经非常熟悉了,__init__方法通常用在初始化一个类实例的时候。例如:#-*-coding:utf-8-*-classPerson(object):"""SillyPerson"""def__init__(self,name,age):self.name=nameself.age=agedef__str__(self):return''%(self.name

系统 2019-09-27 17:47:53 1919

Python

纯 Python 实现的 Google 批量翻译!

首先声明,没有什么不良动机,因为经常会用translate.google.cn,就想着用Python模拟网页提交实现文档的批量翻译。据说有API,可是要收费。生成TokenGoogle为防爬虫而生成token的代码是Javascript的,且是根据网站的TKK值和提交的文本动态生成。网上搜到的一段Python代码有点小Bug,且缺少动态获取TKK的步骤。最后还是对照Javascript代码自己改成Python了。方法很简单,先转成易懂的Javascript

系统 2019-09-27 17:47:50 1919

Python

Python3之字节串bytes与字节数组bytearray的使用详解

字节串bytes字节串也叫字节序列,是不可变的序列,存储以字节为单位的数据字节串表示方法:b"ABCD"b"\x41\x42"...字节串的构造函数:bytes()创建一个空的字节串,同b””bytes(整数可迭代对象)用可迭代对象创建一个字节串bytes(整数n)生成n个值为0的字节串bytes(字符串,encoding='utf-8')转码字节串的运算:同其他序列的运算+、+=、*、*=<、<=、>、>=、!=、==in/notin切片和索引函数:le

系统 2019-09-27 17:47:04 1919

Python

python协程gevent案例 爬取斗鱼图片过程解析

分析分析网站寻找需要的网址用谷歌浏览器摁F12打开开发者工具,然后打开斗鱼颜值分类的页面,如图:在里面的请求中,最后发现它是以ajax加载的数据,数据格式为json,如图:圈住的部分是我们需要的数据,然后复制它的网址为https://www.douyu.com/gapi/rknc/directory/yzRec/1,出于学习目的只爬取第一页(减少服务器压力)。然后把网址放到浏览器中测试是否可以访问。如图:结果正常。分析json数据,提取图片链接最后分析发现

系统 2019-09-27 17:46:57 1919

Python

Python常用正则表达式符号浅析

对Python中正则表达式的理解,主要就是对符号的理解,本文即对Python中常用的正则表达式符号进行简析。其主要的符号有:.默认匹配一个字符,不包含换行符,如果设置DOTALL则匹配换行符^匹配行首$匹配行尾*匹配0个或者多个重复+匹配一个或者多个重复?匹配一个或者零个重复*?,+?,??按照非贪婪模式匹配{m},{m,n},{m,n}?分别匹配m个重复,m至n个重复,m至n个重复按照非贪婪模式\转义[][abc],[a-z][^a-z]|或者匹配'a|

系统 2019-09-27 17:46:52 1919

Python

一行Python代码过滤标点符号等特殊字符

很多时候我们需要过滤掉标点符号等特殊字符,网上虽然有一堆的方法,但是都没有找到一个非常满意的,有些过滤不了中文的标点符号,有些过滤不了英文的标点符号,有些过滤不全。最后通过查看正则表达式文档,发现一个高效的办法,一行代码就能搞定:defreplace_all_blank(value):"""去除value中的所有非字母内容,包括标点符号、空格、换行、下划线等:paramvalue:需要处理的内容:return:返回处理后的内容"""#\W表示匹配非数字字母

系统 2019-09-27 17:46:03 1919

Python

Python过滤函数filter()使用自定义函数过滤序列实例

filter函数:filter()函数可以对序列做过滤处理,就是说可以使用一个自定的函数过滤一个序列,把序列的每一项传到自定义的过滤函数里处理,并返回结果做过滤。最终一次性返回过滤后的结果。filter()函数有两个参数:第一个,自定函数名,必须的第二个,需要过滤的列,也是必须的DEMO需求,过滤大于5小于10的数:复制代码代码如下:#coding=utf8#定义大于5小于10的函数defguolvhanshu(num):ifnum>5andnum<10:

系统 2019-09-27 17:46:02 1919

Python

学习python之编写简单简单连接数据库并执行查询操作

python连接数据库操作,方法如下:在本机的mysql数据库中有一个名为yao的库,其中有一个名为user的表,表中的内容如图下面,则是python连接数据库的方法,及查找出表中的内容,代码如下:#!/usr/bin/python#filenameconn.pyimportMySQLdb#载入连接数据库模块try:#尝试连接数据库conn=MySQLdb.connect("localhost","root","www","yao",charset="ut

系统 2019-09-27 17:37:52 1919