搜索到与相关的文章
Python

使用Python Pandas处理亿级数据的方法

在数据分析领域,最热门的莫过于Python和R语言,此前有一篇文章《别老扯什么Hadoop了,你的数据根本不够大》指出:只有在超过5TB数据量的规模下,Hadoop才是一个合理的技术选择。这次拿到近亿条日志数据,千万级数据已经是关系型数据库的查询分析瓶颈,之前使用过Hadoop对大量文本进行分类,这次决定采用Python来处理数据:硬件环境CPU:3.5GHzIntelCorei7内存:32GBHDDR31600MHz硬盘:3TBFusionDrive数据

系统 2019-09-27 17:57:15 2223

Python

python获取Linux发行版名称

我必须从Python脚本中获取Linux发行版名称。dist平台模块中有一个方法:importplatformplatform.dist()但在我的ArchLinux下它返回:>>>platform.dist()('','','')为什么?我怎么能得到这个名字?PS。我必须检查分发是否是基于Debian的。更新:我在这里找到了Python站点,自2.6以来,dist()已被弃用。>>>platform.linux_distribution()('','',

系统 2019-09-27 17:56:24 2223

Python

python格式化字符串实例总结

本文实例总结了python格式化字符串的方法,分享给大家供大家参考。具体分析如下:将python字符串格式化方法以例子的形式表述如下:*定义宽度Python代码如下:>>>'%*s'%(5,'some')'some'-左对齐Python代码如下:>>>'%-*s'%(5,'some')'some'最小宽度为6的2位精度的浮点小数,位数不够时前补空格Python代码如下:>>>'%6.2f'%8.123'8.12'字典形式,可在正数前显示加号,位数不够时前面

系统 2019-09-27 17:56:12 2223

Python

利用python numpy+matplotlib绘制股票k线图的方法

一、pythonnumpy+matplotlib画股票k线图#--coding:utf-8--importrequestsimportnumpyasnpfrommatplotlibimportpyplotaspltfrommatplotlibimportanimationfig=plt.figure(figsize=(8,6),dpi=72,facecolor="white")axes=plt.subplot(111)axes.set_title('Sha

系统 2019-09-27 17:55:36 2223

Python

python使用装饰器作日志处理的方法

装饰器这东西我看了一会儿才明白,在函数外面套了一层函数,感觉和java里的aop功能很像;写了2个装饰器日志的例子,第一个是不带参数的装饰器用法示例,功能相当于给函数包了层异常处理,第二个是带参数的装饰器用法示例,将日志输出到文件。```#coding=utf8importtracebackimportloggingfromlogging.handlersimportTimedRotatingFileHandlerdeflogger(func):defin

系统 2019-09-27 17:54:25 2223

Python

Python3网络爬虫实战-10、爬虫框架的安装:PySpider

我们直接用Requests、Selenium等库写爬虫,如果爬取量不是太大,速度要求不高,是完全可以满足需求的。但是写多了会发现其内部许多代码和组件是可以复用的,如果我们把这些组件抽离出来,将各个功能模块化,就慢慢会形成一个框架雏形,久而久之,爬虫框架就诞生了。利用框架我们可以不用再去关心某些功能的具体实现,只需要去关心爬取逻辑即可。有了它们,可以大大简化代码量,而且架构也会变得清晰,爬取效率也会高许多。所以如果对爬虫有一定基础,上手框架是一种好的选择。本

系统 2019-09-27 17:53:32 2223

Python

python2.7.5升级到pyhon3.6.9

一.安装所需包yum-yinstallsqlite-develxzgccautomakezlib-developenssl-develepel-release二.下载python3.6.9https://www.python.org/ftp/python/3.6.9/wgethttps://www.python.org/ftp/python/3.6.9/Python-3.6.9.tgztarzxvfPython-3.6.9.tgzcdPython-3.6.

系统 2019-09-27 17:52:16 2223

Python

学习记录---python 直方图及显示数值

如题、学习、保存1源码#-*-coding:utf-8-*-'''time:2019-8-21author:Bing'''importmatplotlib.pyplotasplt#num_list=[1.5,0.6,7.8,6]fig,ax=plt.subplots()num_list=[7870,81937,17529598,6225227]name_list=['Eviction','Failed','Finished','Killed']b=ax.b

系统 2019-09-27 17:51:29 2223

Python

解决python3 requests headers参数不能有中文的问题

1需求,heeaders参数需要拼接中文参数param解决如下url='https://....search?keyword='+param+'&templateId=&page=1&pageSize=10'headers={"Accept":"application/json,text/javascript,*/*;q=0.01","Accept-Encoding":"gzip,deflate,br","Accept-Language":"zh-CN,z

系统 2019-09-27 17:51:00 2223

Python

如何美观地打印 Python 对象?这个标准库可以简单实现

前不久,我写了一篇文章回顾Python中print的发展历史,提到了两条发展线索:明线:早期的print语句带有C和Shell的影子,是个应用程序级的statement,在最初十几年里,经历过PEP-214和PEP-259的改进;再到2009年的大版本3.0,由语句改成了print()函数,还在3.3版本,做过一次功能增强,最终上升成为一等的内置函数。暗线:介绍了print的竞争对手们,像传统的日志模块logging、调试模块pdb、主流IDE的调试功能,

系统 2019-09-27 17:48:34 2223