需要准备的环境:一个B站账号,需要先登录,否则不能查看历史弹幕记录联网的电脑和顺手的浏览器,我用的ChromePython3环境以及request模块,安装使用命令,换源比较快:pip3installrequest-ihttp://pypi.douban.com/simple爬取步骤:登录后打开需要爬取的视频页面,打开开发者工具台,Chrome可以使用F12快捷键,选择network监听请求点击查看历史弹幕,获取请求其中rolldate后面的数字表示该视频
系统 2019-09-27 17:52:52 1932
一、反射1什么是反射反射的概念是由Smith在1982年首次提出的,主要是指程序可以访问、检测和修改它本身状态或行为的一种能力(自省)。这一概念的提出很快引发了计算机科学领域关于应用反射性的研究。它首先被程序语言的设计领域所采用,并在Lisp和面向对象方面取得了成绩。2python面向对象中的反射:通过字符串的形式操作对象相关的属性。python中的一切事物都是对象(都可以使用反射)四个可以实现自省的函数下列方法适用于类和对象(一切皆对象,类本身也是一个对
系统 2019-09-27 17:52:50 1932
爬虫成果当你运行代码后,文件夹就会越来越多,如果爬完的话会有2000多个文件夹,20000多张图片。不过会很耗时间,可以在最后的代码设置爬取页码范围。本文目标熟悉Requests库,BeautifulSoup库熟悉多线程爬取送福利,妹子图网站结构我们从http://meizitu.com/a/more_1.html这个链接进去,界面如图一所示图一:可以看到是一组一组的套图,点击任何一组图片会进入到详情界面,如图二所示图二:可以看到图片是依次排开的,一般会有
系统 2019-09-27 17:51:31 1932
01前言Python现有的版本多,每个项目使用的Python版本都不一样,管理起来比较麻烦。github有一个项目叫做pyenv,它是一个多版本管理工具,非常好用,不但支持多版本,而且可以自由切换。本文以CentOS7平台为例,演示pyenv的功能。本文转自我个人的公众号:天目星,请大家多多关注。请关注我的微信公众号一、安装pyenv的项目地址:https://github.com/pyenv/pyenvPS:安装pyenv前需要安装相关依赖包$yumin
系统 2019-09-27 17:48:50 1932
模块的的作用主要是用于字符串和文本处理,查找,搜索,替换等复习一下基本的正则表达式吧.:匹配除了换行符以为的任意单个字符*:匹配任意字符,一个,零个,多个都能匹配得到俗称贪婪模式+:匹配位于+之前的一个或者多个字符|:匹配位于|之前或者之后的字符^:匹配行首$:匹配行尾?:匹配位于?之前的零个或者一个字符,不匹配多个字符\:表示\之后的为转义字符[]:匹配[]之中的任意单个字符,[0-9]表示匹配0到9任意一个数字():将位于()之内的的内容当作一个整体{
系统 2019-09-27 17:47:27 1932
前些天用python处理xml的转换的一个小程序,用来把xml,xsl转换成html。用的libxml2,所以还要先安装了libxml2模块才能使用。#-*-coding:mbcs-*-#!/usr/bin/pythonimportlibxml2,libxsltclasscompoundXML:def__init__(self):self._result=Noneself._xsl=Noneself._xml=Nonedefdo(self,xml_file
系统 2019-09-27 17:47:12 1932
Python中乱码问题是一个很头痛的问题。在Python3中,对中文进行了全面的支持,但在Python2.x中需要进行相关的设置才能使用中文。否则会出现乱码【问题原因】在Python2.x中主要是字符编码的问题,处理不好的话,会导致乱码。Python默认采取的ASCII编码,字母、标点和其他字符只使用一个字节来表示,但对于中文字符来说,一个字节满足不了需求。复制代码代码如下:>>>importsys>>>sys.getdefaultencoding()'a
系统 2019-09-27 17:46:00 1932
1.爬取豆瓣top250书籍importrequestsimportjsonimportcsvfrombs4importBeautifulSoupbooks=[]defbook_name(url):res=requests.get(url)html=res.textsoup=BeautifulSoup(html,'html.parser')items=soup.find(class_="grid-16-8clearfix").find(class_="in
系统 2019-09-27 17:45:26 1932
openpyxl是一个第三方库,可以处理xlsx格式的Excel文件。pipinstallopenpyxl安装。读取Excel文件需要导入相关函数fromopenpyxlimportload_workbook#默认可读写,若有需要可以指定write_only和read_only为Truewb=load_workbook('pythontab.xlsx')默认打开的文件为可读写,若有需要可以指定参数read_only为True。获取工作表--Sheet#获得
系统 2019-09-27 17:38:23 1932
按单词反转字符串是一道很常见的面试题。在Python中实现起来非常简单。defreverse_string_by_word(s):lst=s.split()#splitbyblankspacebydefaultreturn''.join(lst[::-1])s='PowerofLove'printreverse_string_by_word(s)#LoveofPowers='HelloWorld!'printreverse_string_by_word(s
系统 2019-09-27 17:37:55 1932