- 军军小站|张军博客
搜索到与相关的文章
Python

python使用pandas处理大数据节省内存技巧(推荐)

一般来说,用pandas处理小于100兆的数据,性能不是问题。当用pandas来处理100兆至几个G的数据时,将会比较耗时,同时会导致程序因内存不足而运行失败。当然,像Spark这类的工具能够胜任处理100G至几个T的大数据集,但要想充分发挥这些工具的优势,通常需要比较贵的硬件设备。而且,这些工具不像pandas那样具有丰富的进行高质量数据清洗、探索和分析的特性。对于中等规模的数据,我们的愿望是尽量让pandas继续发挥其优势,而不是换用其他工具。本文我们

系统 2019-09-27 17:49:29 1824

Python

Python应用领域和就业形势分析总结

简单的说,Python是一个“优雅”、“明确”、“简单”的编程语言。学习曲线低,非专业人士也能上手开源系统,拥有强大的生态圈解释型语言,完美的平台可移植性支持面向对象和函数式编程能够通过调用C/C++代码扩展功能代码规范程度高,可读性强目前几个比较流行的领域,Python都有用武之地。云基础设施-Python/Java/GoDevOps-Python/Shell/Ruby/Go网络爬虫-Python/PHP/C++数据分析挖掘-Python/R/Scala

系统 2019-09-27 17:49:25 1824

Python

Python调用C

文章作者:Tyan博客:noahsnail.com|CSDN|简书1.引言众所周知,Python语言简单、易学、开源、具有丰富的库,Python的第一个编译器是用C语言实现的。但Python的缺点也非常明显,最让人诟病的就是Python的性能问题。因此,为了提高程序的运行效率,通常会将程序的关键部分使用C或C++重写,编译成动态链接库,然后在Python(CPython)中进行调用。运行环境:Ubuntu16.04、Python2.7、Python3.5。

系统 2019-09-27 17:49:17 1824

Python

使用Python脚本在Linux下实现部分Bash Shell的教程

对于Linux用户来说,命令行的名声相当的高。不像其他操作系统,命令行是一个可怕的命题,但是对于Linux社区中那些经验丰富的大牛,命令行却是最值得推荐鼓励使用的。通常,命令行对比图形用户界面,更能提供更优雅和更高效的解决方案。命令行伴随着Linux社区的成长,UNIXshells,例如bash和zsh,已经成长为一个强大的工具,也是UNIXshell的重要组成部分。使用bash和其他类似的shells,可以得到一些很有用的功能,例如,管道,文件名通配符和

系统 2019-09-27 17:49:16 1824

Python

Python with as 的实现原理

有一些任务,可能事先需要设置,事后做清理工作。对于这种场景,Python的with语句提供了一种非常方便的处理方式。一个很好的例子是文件处理,你需要获取一个文件句柄,从文件中读取数据,然后关闭文件句柄。如果不用with语句,代码如下:file=open("/tmp/foo.txt")data=file.read()file.close()这里有两个问题。一是可能忘记关闭文件句柄;二是文件读取数据发生异常,没有进行任何处理。下面是处理异常的加强版本:file

系统 2019-09-27 17:48:03 1824

Python

Python中用max()方法求最大值的介绍

max()方法返回其参数最大值:最接近正无穷大的值。语法以下是max()方法的语法:max(x,y,z,....)参数x--这是一个数值表达式。y--这也是一个数值表达式。z--这是一个数值表达式。返回值此方法返回其参数的最大值。例子下面的例子显示了max()方法的使用。#!/usr/bin/pythonprint"max(80,100,1000):",max(80,100,1000)print"max(-20,100,400):",max(-20,100

系统 2019-09-27 17:47:38 1824

Python

一行Python代码能实现什么丧心病狂的功能?

原文链接:https://www.bagevent.com/event/5396631作者|天元浪子来源|CSDN博客手头有109张头部CT的断层扫描图片,我打算用这些图片尝试头部的三维重建。基础工作之一,就是要把这些图片数据读出来,组织成一个三维的数据结构(实际上是四维的,因为每个像素有RGBA四个通道)。这个数据结构,自然是numpy的ndarray对象,读取图像文件我习惯使用PIL。因此,需要导入两个模块:1importnumpyasnp2fromP

系统 2019-09-27 17:47:36 1824

Python

python实现图片压缩代码实例

前言项目中大量用到图片加载,由于图片太大,加载速度很慢,因此需要对文件进行统一压缩一:导入包fromPILimportImageimportos二:获取图片文件的大小defget_size(file):#获取文件大小:KBsize=os.path.getsize(file)returnsize/1024三:拼接输出文件地址defget_outfile(infile,outfile):ifoutfile:returnoutfiledir,suffix=os.

系统 2019-09-27 17:46:02 1824

Python

闭包在python中的应用之translate和maketrans用法详解

相对来说python对字符串的处理是比较高效的,方法也有很多。其中maketrans和translate两个方法被应用的很多,本文就针对这两个方法的用法做一总结整理。首先让我们先回顾下这两个方法:①s.translate(table,str)对字符串s移除str包含的字符,剩下的字符串按照table里的字符映射关系替换。table可以理解为转换表,比较'a'->'A','b'->'B'.②tabel=string.maketrans('s1','s2')s

系统 2019-09-27 17:45:59 1824

Python

Python数据结构与算法(几种排序)小结

Python数据结构与算法(几种排序)数据结构与算法(Python)冒泡排序冒泡排序(英语:BubbleSort)是一种简单的排序算法。它重复地遍历要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。遍历数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端。冒泡排序算法的运作如下:比较相邻的元素。如果第一个比第二个大(升序),就交换他们两个。对每一对相邻元素

系统 2019-09-27 17:45:58 1824