搜索到与相关的文章
Python

Python 绘图,我只用 Matplotlib

01散点图散点图显示两组数据的值,如图1-1所示。每个点的坐标位置由变量的值决定,并由一组不连接的点完成,用于观察两种变量的相关性。例如,身高—体重、温度—维度。图1-1散点图示例使用Matplotlib的scatter()函数绘制散点图,其中x和y是相同长度的数组序列。scatter()函数的一般用法为:主要参数说明如下:x,y:数组。s:散点图中点的大小,可选。c:散点图中点的颜色,可选。marker:散点图的形状,可选。alpha:表示透明度,在0~

系统 2019-09-27 17:52:53 2220

Python

python3读csv文件 UnicodeDecodeError

使用pd.read_csv()读csv文件时,出现如下错误:UnicodeDecodeError:'utf-8'codeccan'tdecodebyte0x82inposition743:invalidstartbyte出现原因:文件不是UTF8编码的,而系统默认采用UTF8解码。解决方法是改为对应的解码方式。解决办法:1、用记事本修改找到csv文件–》右键–》打开方式–》记事本打开记事本之后,选择头部菜单的“文件–》另存为”,可以看到文件的默认编码格式为

系统 2019-09-27 17:52:21 2220

Python

使用Python检测文章抄袭及去重算法原理解析

在互联网出现之前,“抄”很不方便,一是“源”少,而是发布渠道少;而在互联网出现之后,“抄”变得很简单,铺天盖地的“源”源源不断,发布渠道也数不胜数,博客论坛甚至是自建网站,而爬虫还可以让“抄”完全自动化不费劲。这就导致了互联网上的“文章”重复性很高。这里的“文章”只新闻、博客等文字占据绝大部分内容的网页。中文新闻网站的“转载”(其实就是抄)现象非常严重,这种“转载”几乎是全文照抄,或改下标题,或是改下编辑姓名,或是文字个别字修改。所以,对新闻网页的去重很有

系统 2019-09-27 17:51:18 2220

Python

使用Python的Treq on Twisted来进行HTTP压力测试

从事API相关的工作很有挑战性,在高峰期保持系统的稳定及健壮性就是其中之一,这也是我们在Mailgun做很多压力测试的原因。这么久以来,我们已经尝试了很多种方法,从简单的ApacheBench到复杂些的自定义测试套。但是本贴讲述的,是一种使用python进行“快速粗糙”却非常灵活的压力测试的方法。使用python写HTTP客户端的时候,我们都很喜欢用Requestslibrary。这也是我们向我们的API用户们推荐的。Requests很强大,但有一个缺点,

系统 2019-09-27 17:49:27 2220

Python

【python】扫描路径与文件列表

importosimportsocketfile_path=os.getcwd()print('目录'+file_path+'中的文件包括:')print_dir_files(file_path)#print('***获取当前目录***')#print(os.getcwd())print(os.path.abspath(os.path.dirname(__file__)))print('***获取上级目录***')#print(os.path.abspat

系统 2019-09-27 17:47:46 2220

Python

Python使用python-docx读写word文档

python-docx库可用于创建和编辑MicrosoftWord(.docx)文件。官方文档:链接地址备注:doc是微软的专有的文件格式,docx是MicrosoftOffice2007之后版本使用,其基于OfficeOpenXML标准的压缩文件格式,比doc文件所占用空间更小。docx格式的文件本质上是一个ZIP文件,所以其实也可以把.docx文件直接改成.zip,解压后,里面的word/document.xml包含了Word文档的大部分内容,图片文件

系统 2019-09-27 17:47:43 2220

Python

python爬取百度贴吧前1000页内容(requests库面向对象思想实现)

此程序以李毅吧为例子,以面向对象的设计思想实现爬取保存网页数据,暂时并未用到并发处理,以后有机会的话会加以改善首先去百度贴吧分析贴吧地址栏中url后的参数,找到分页对应的参数pn,贴吧名字对应的参数kw首先创建类,写好__init__方法,run方法,__init__方法里先可以直接写passrun方法里大概整理一下整体的思路构造url列表,因为要爬取1000页,每页需对应一个url遍历发送请求,获取响应保存将可封装的步骤封装到单独的方法,所以这里又增加了

系统 2019-09-27 17:46:58 2220

Python

python学习笔记之configparese

configparse#importconfigparser#config=configparser.ConfigParser()#config["DEFAULT"]={'ServerAliveInterval':'45',#'Compression':'yes',#'CompressionLevel':'9',#'ForwardX11':'yes'#}#config['bitbucket.org']={'User':'hg'}##config['tops

系统 2019-09-27 17:46:08 2220

编程技术

三岁孩子的网上购物经历

介绍一个有趣的网站,有些原文链接,还可以学英语。一日一冷新闻:搞笑,三岁小孩自己上网订购一台挖掘机来自新西兰Auckland一家的故事。3岁的罗莉趁父母熟睡之际打开电脑,登陆某购物网站,最终为自己订购了一台挖掘机。当妈妈Sarah清晨醒来打开电脑收取有件时,竟然发现自己已经购买了一辆售价2w新西兰元的挖掘机。没得说,用Sarash当时的原话就是‘shockofmylife’。经过简单调查之后,Sarah发现是家里3岁的小女孩PipiQuinlan所为。Sa

系统 2019-08-29 23:48:48 2220

编程技术

解决Opera的本地化字体显示问题!

因为黄金的存储量少,所以价值高,Opera的市场占有率蛮低,想必也应该蛮好的吧!上官网下载Opera的国际化版,安装之后打开来看,字体渲染一它糊涂,如下图:经多方查证和搜索,现得出如下解决方法:首选项-高级-字体。修改浏览器菜单、浏览器工具栏、对话框、面板、工具提示、普通文字为宋体好了,最小字体大小设置为12就ok了。(当然你也可以修改为其他字体)。解决Opera的本地化字体显示问题!

系统 2019-08-29 23:40:56 2220