搜索到与相关的文章
Python

python使用pandas处理大数据节省内存技巧(推荐)

一般来说,用pandas处理小于100兆的数据,性能不是问题。当用pandas来处理100兆至几个G的数据时,将会比较耗时,同时会导致程序因内存不足而运行失败。当然,像Spark这类的工具能够胜任处理100G至几个T的大数据集,但要想充分发挥这些工具的优势,通常需要比较贵的硬件设备。而且,这些工具不像pandas那样具有丰富的进行高质量数据清洗、探索和分析的特性。对于中等规模的数据,我们的愿望是尽量让pandas继续发挥其优势,而不是换用其他工具。本文我们

系统 2019-09-27 17:49:29 2022

Python

Linux下Python脚本自启动和定时启动的详细步骤

一、Python开机自动运行假如Python自启动脚本为auto.py。那么用root权限编辑以下文件:sudovim/etc/rc.local如果没有rc.local请看这篇文章在exit0上面编辑启动脚本的命令/usr/bin/python3/home/selfcs/auto.py>/home/selfcs/auto.log最后重启Linux,脚本就能自动运行并打印日志了。二、让Python脚本定时启动用root权限编辑以下文件sudovim/etc/

系统 2019-09-27 17:49:28 2022

Python

python实现随机漫步方法和原理

我们通过模拟随机漫步可以说明如何运用数组运算。通过内置的random模块以纯Python的方式实现1000步的随机漫步根据前100个随机漫步值生成的折线图,plt.plot(walk[:100])随机漫步中各步的累计和,可以用一个数组运算来实现。因此,我用np.random模块一次性随机产生1000个“掷硬币”结果(即两个数中任选一个),将其分别设置为1或-1,然后计算累计和我们就可以沿着漫步路径做一些统计工作了,比如求取最大值和最小值假设我们想要知道本次

系统 2019-09-27 17:49:14 2022

Python

把项目从Python2.x移植到Python3.x的经验总结

经历移植jinja2到python3的痛苦之后,我把项目暂时放一放,因为我怕打破python3的兼容。我的做法是只用一个python2的代码库,然后在安装的时候用2to3工具翻译成python3。不幸的是哪怕一点点的改动都会打破迭代开发。如果你选对了python的版本,你可以专心做事,幸运的避免了这个问题。来自MoinMoin项目的ThomasWaldmann通过我的python-modernize跑jinja2,并且统一了代码库,能同时跑python2,

系统 2019-09-27 17:49:06 2022

Python

Python 命令行之旅:深入 argparse(二)

作者:HelloGitHub-ProdesireHelloGitHub的《讲解开源项目》系列,项目地址:https://github.com/HelloGitHub-Team/Article前言在上一篇“深入argparse(一)”的文章中,我们深入了解了argparse的包括参数动作和参数类别在内的基本功能,具备了编写一个简单命令行程序的能力。本文将继续深入了解argparse的进阶玩法,一窥探其全貌,助力我们拥有实现复杂命令行程序的能力。本系列文章默认

系统 2019-09-27 17:47:16 2022

Python

在Python中操作日期和时间之gmtime()方法的使用

gmtime()方法转换历元到一struct_time以UTC其中dst的标志值始终为0以秒表示时间。如果不设置秒时或None,返回的时间为当前time()。语法以下是gmtime()方法的语法:time.gmtime([sec])参数sec--这是秒数转换成结构struct_time来表示。返回值此方法不返回任何值。例子下面的例子显示了gmtime()方法的使用。#!/usr/bin/pythonimporttimeprint"time.gmtime()

系统 2019-09-27 17:46:42 2022

Python

Python中实现字符串类型与字典类型相互转换的方法

本文以实例形式简述了Python中字符串类型与字典类型相互转换的方法,是比较实用的功能。具体方法如下:一、字典(dict)转为字符串(string)我们可以比较容易的将字典(dict)类型转为字符串(string)类型。通过遍历dict中的所有元素就可以实现字典到字符串的转换:forkey,valueinsample_dic.items():print"\"%s\":\"%s\""%(key,value)二、字符串(string)转为字典(dict)如何将

系统 2019-09-27 17:46:40 2022

Python

Python开发必备的30个编程技巧

直接交换2个数字的位置Python提供了一种直观的方式在一行代码中赋值和交换(变量值)。如下所示:x,y=10,20print(x,y)x,y=y,xprint(x,y)#1(10,20)#2(20,10)在上面代码中,赋值的右侧形成了一个新元组,而左侧则立刻将该(未被引用的)元组解包到名称和。待赋值完成后,新元组就变成了未被引用状态,并且被标为可被垃圾回收,最终也就发生了数字交换。链接比较操作符比较运算符的聚合是另一种有时用起来很顺手的技巧。n=10re

系统 2019-09-27 17:46:28 2022

Python

Neo4j 第十二篇:使用Python驱动访问Neo4j

neo4j官方驱动支持Python语言,驱动程序主要包含Driver类型和Session类型。Driver对象包含Neo4j数据库的详细信息,包括主机url、安全验证等配置,还管理着连接池(ConnectionPool);Session对象是执行事务单元的逻辑上下文,事务是在Session的上下文中执行的。由于Session不是线程安全的,并能够从Driver对象管理的连接池中回收利用(Recycle)连接,因此,Session对象是轻量级的(lightw

系统 2019-09-27 17:45:32 2022

Python

分析python请求数据

本节讲解了flask的请求,如果想在没有请求的情况下获取上下文,可以使用test_request_context()或者request_context(),从request对象的form中可以获取表单的数据,args中可以获取URL中的参数,files可以获取上传的文件,cookies可以操作cookie。首先你需要从flask模块中导入request:fromflaskimportrequest当前请求的方法可以用method属性来访问。你可以用form

系统 2019-09-27 17:38:46 2022