搜索到与相关的文章
Python

python爬虫 2019中国好声音评论爬取过程解析

2019中国好声音火热开播,作为一名“假粉丝”,这一季每一期都刷过了,尤其刚播出的第六期开始正式的battle。视频视频看完了,那看下大家都是怎样评论的。1.网页分析部分本文爬取的是腾讯视频评论,第六期的评论地址是:http://coral.qq.com/4093121984每页有10条评论,点击“查看更多评论”,可将新的评论加载进来,通过多次加载,可以发现我们要找的评论就在以v2开头的js类型的响应中。请求为GET请求,地址是http://coral.q

系统 2019-09-27 17:48:03 1919

Python

30行python代码爬取历年双色球

当年学爬虫的第一个想法就是想把双色球的数据爬下来,然后看能不能用什么牛叉的算法,或者数据分析把后面的双色球概率算出来;知道现在才抽空写了这几行代码爬取了双色球的数据,我也真是够懒的;也算是闲来无事,练手的爬虫吧;好了,多余的就不说了,直接上代码吧,代码注释已经很清楚了;importsysimportrequestsfromlxmlimportetreedefget_url(url):#请求url的方法,返回htmlheaders={'User-Agent'

系统 2019-09-27 17:47:57 1919

Python

第10课 python 函数

今日有点晚,上午去hilston开会广东省科学院&白俄罗斯科学院所长会议。。。学习了一个上午,简直收获良多。。下午又多问题处理。。。。网站又聚餐。。只能回来加加班处理一下今日的内容了(不坚持,又被遗忘了),还是要坚持一下学习Python,不然真是忘记忘记再忘记,之后就不搞了。。。今日我们说函数:1.函数从小学-初中经常说的x=y+1,x,y都是有因果关系的,我们叫函数。今日我们在编程说的函数有区别的。他是一个代码的报装,当然也有因果关系。你执行/调用有相关

系统 2019-09-27 17:47:56 1919

Python

Python中__init__和__new__的区别详解

__init__方法是什么?使用Python写过面向对象的代码的同学,可能对__init__方法已经非常熟悉了,__init__方法通常用在初始化一个类实例的时候。例如:#-*-coding:utf-8-*-classPerson(object):"""SillyPerson"""def__init__(self,name,age):self.name=nameself.age=agedef__str__(self):return''%(self.name

系统 2019-09-27 17:47:53 1919

Python

纯 Python 实现的 Google 批量翻译!

首先声明,没有什么不良动机,因为经常会用translate.google.cn,就想着用Python模拟网页提交实现文档的批量翻译。据说有API,可是要收费。生成TokenGoogle为防爬虫而生成token的代码是Javascript的,且是根据网站的TKK值和提交的文本动态生成。网上搜到的一段Python代码有点小Bug,且缺少动态获取TKK的步骤。最后还是对照Javascript代码自己改成Python了。方法很简单,先转成易懂的Javascript

系统 2019-09-27 17:47:50 1919

Python

python新手经常遇到的17个错误分析

1)忘记在if,elif,else,for,while,class,def声明末尾添加:(导致“SyntaxError:invalidsyntax”)该错误将发生在类似如下代码中:ifspam==42print('Hello!')2)使用=而不是==(导致“SyntaxError:invalidsyntax”)=是赋值操作符而==是等于比较操作。该错误发生在如下代码中:ifspam=42:print('Hello!')3)错误的使用缩进量。(导致“Inde

系统 2019-09-27 17:47:06 1919

Python

Python3之字节串bytes与字节数组bytearray的使用详解

字节串bytes字节串也叫字节序列,是不可变的序列,存储以字节为单位的数据字节串表示方法:b"ABCD"b"\x41\x42"...字节串的构造函数:bytes()创建一个空的字节串,同b””bytes(整数可迭代对象)用可迭代对象创建一个字节串bytes(整数n)生成n个值为0的字节串bytes(字符串,encoding='utf-8')转码字节串的运算:同其他序列的运算+、+=、*、*=<、<=、>、>=、!=、==in/notin切片和索引函数:le

系统 2019-09-27 17:47:04 1919

Python

一行Python代码过滤标点符号等特殊字符

很多时候我们需要过滤掉标点符号等特殊字符,网上虽然有一堆的方法,但是都没有找到一个非常满意的,有些过滤不了中文的标点符号,有些过滤不了英文的标点符号,有些过滤不全。最后通过查看正则表达式文档,发现一个高效的办法,一行代码就能搞定:defreplace_all_blank(value):"""去除value中的所有非字母内容,包括标点符号、空格、换行、下划线等:paramvalue:需要处理的内容:return:返回处理后的内容"""#\W表示匹配非数字字母

系统 2019-09-27 17:46:03 1919

Python

Python过滤函数filter()使用自定义函数过滤序列实例

filter函数:filter()函数可以对序列做过滤处理,就是说可以使用一个自定的函数过滤一个序列,把序列的每一项传到自定义的过滤函数里处理,并返回结果做过滤。最终一次性返回过滤后的结果。filter()函数有两个参数:第一个,自定函数名,必须的第二个,需要过滤的列,也是必须的DEMO需求,过滤大于5小于10的数:复制代码代码如下:#coding=utf8#定义大于5小于10的函数defguolvhanshu(num):ifnum>5andnum<10:

系统 2019-09-27 17:46:02 1919

Python

史诗级干货-python爬虫之增加CSDN访问量

史诗级干货-python爬虫之增加CSDN访问量搜索微信公众号:‘AI-ming3526’或者’计算机视觉这件小事’获取更多算法、机器学习干货csdn:https://blog.csdn.net/baidu_31657889/github:https://github.com/aimi-cn/AILearners文章初衷:最近CSDN官方出了一个流量扶持计划,针对原创文章进行百度推广,我尝试推了几篇,效果也不是很好,或者是自己文章水平不够,太水~就想着增加

系统 2019-09-27 17:45:32 1919