摘要在进行数据分析时,我们经常需要对DataFrame去重,但有时候也会需要只保留重复值。这里就简单的介绍一下对于DataFrame去重和取重复值的操作。创建DataFrame这里首先创建一个包含一行重复值的DataFrame。DataFrame去重,可以选择是否保留重复值,默认是保留重复值,想要不保留重复值的话直接设置参数keep为False即可。3.取DataFrame重复值。大多时候我们都是需要将数据去重,但是有时候很我们也需要取重复数据,这个时候我
系统 2019-09-27 17:56:02 2075
目录瞎比比与print相比logging有什么优势?基础用法保存到文件多模块使用logging使用配置文件配置logging瞎比比这篇文章其实早在一个月之前就写好了。奈何,加班猛如虎,真的怕了。直至今天才幸运地有了个双休,赶紧排版一下文章发布了。以下为正文。在初学Python的时候,我们使用print("helloworld")输出了我们的第一行代码。在之后的日子里,便一直使用print进行调试(当然,还有IDE的debug模式)。但是,当你在线上运行Py
系统 2019-09-27 17:55:27 2075
关于如何获取access_token这个可以自己查百度开放的OAuth2.0的API。这里不做介绍。第三方Python库poster复制代码代码如下:#coding:UTF-8importurllibimporturllib2__author__='Administrator'fromposter.encodeimportmultipart_encodefromposter.streaminghttpimportregister_openersregist
系统 2019-09-27 17:54:41 2075
需要准备的环境:一个B站账号,需要先登录,否则不能查看历史弹幕记录联网的电脑和顺手的浏览器,我用的ChromePython3环境以及request模块,安装使用命令,换源比较快:pip3installrequest-ihttp://pypi.douban.com/simple爬取步骤:登录后打开需要爬取的视频页面,打开开发者工具台,Chrome可以使用F12快捷键,选择network监听请求点击查看历史弹幕,获取请求其中rolldate后面的数字表示该视频
系统 2019-09-27 17:52:52 2075
在我遇到SimPy包的其中一位创始人KlausMiller时,从他那里知道了这个包。Miller博士阅读过几篇提出使用Python2.2+生成器实现半协同例程和“轻便”线程的技术的可爱的Python专栏文章。特别是(使我很高兴的是),他发现在用Python实现Simula-67样式模拟时,这些技术很有用。结果表明TonyVignaux和ChangChui以前曾创建了另一个Python库,它在概念上更接近于Simscript,而且该库使用了标准线程技术,而不
系统 2019-09-27 17:49:52 2075
本面试题题库,由公号:非本科程序员整理发布第1题:简述解释型和编译型编程语言?解释型语言编写的程序不需要编译,在执行的时候,专门有一个解释器能够将VB语言翻译成机器语言,每个语句都是执行的时候才翻译。这样解释型语言每执行一次就要翻译一次,效率比较低。用编译型语言写的程序执行之前,需要一个专门的编译过程,通过编译系统,把源高级程序编译成为机器语言文件,翻译只做了一次,运行时不需要翻译,所以编译型语言的程序执行效率高,但也不能一概而论,部分解释型语言的解释器通
系统 2019-09-27 17:49:35 2075
使用Python解释器1.1Python安装从源码编译安装python./configuremakemaketestsudomakeinstall默认python解释器安装在/usr/local/bin/python3.8,可以将/usr/local/bin放到path搜索路径中。在windows系统上,python一般安装在C:\Python38,在windows命令行中,执行命令setpath=%path%;C:\python38将该路径添加到path
系统 2019-09-27 17:49:19 2075
复制代码代码如下:#!/usr/bin/envpython#-*-coding:utf-8-*-importos,base64icon=open('ya.png','rb')iconData=icon.read()iconData=base64.b64encode(iconData)LIMIT=60liIcon=[]whileTrue:sLimit=iconData[:LIMIT]iconData=iconData[LIMIT:]liIcon.append
系统 2019-09-27 17:48:33 2075
前言二级Python第10章《第三方库概览》中介绍了三个库:PyInstallerJiebaWordCloud其中,前两个库是必须掌握的,第三个库是可选学习。因此,编程题中肯定不会出现对于词云库WordCloud的考察要求。但是,从实际应用开发角度讲,这个库是学习时下Python大数据编程必须要掌握的——当然也是比较简单的。安装问题在安装WordCloud过程中遇到失败与成功,特别记录于下。家中机器上的失败安装遗憾的是,家中笔记本上安装的是WINDOWS7
系统 2019-09-27 17:48:29 2075
PID算法实现importtimeclassPID:def__init__(self,P=0.2,I=0.0,D=0.0):self.Kp=Pself.Ki=Iself.Kd=Dself.sample_time=0.00self.current_time=time.time()self.last_time=self.current_timeself.clear()defclear(self):self.SetPoint=0.0self.PTerm=0.0s
系统 2019-09-27 17:48:24 2075