前言有些人看到这个问题觉得不是问题,是嘛,不就是df.col[]函数嘛,其实忽略了一个重点,那就是我们要省去把csv文件全部读取这个过程,因为如果在面临亿万级别的大规模数据,得到的结果就是boom,boom,boom。我们要使用一下现成的函数里面的参数nrows,和skiprows,一个代表你要读几行,一个代表你从哪开始读,这就可以了,比如从第3行读取4个示例代码importpandasaspddf=pd.DataFrame({'a':[1,2,3,4,5
系统 2019-09-27 17:54:21 2125
#将字符串中的元素完成特定的向右移动,参数:字符串、移动长度如:abcdef,移动2,结果:efabcd#原始方法,基本思想:末尾元素移动到开头,其他的元素依次向后移动.代码如下:defmove(lt,n):lt=list(lt)#将字符串转换为列表foriinrange(n%len(lt)):#确定移动几次,比如说移动从长度和列表的长度相同时,就没必要移动t=lt[len(lt)-1]#取出末尾元素forjinreversed(range(len(lt)
系统 2019-09-27 17:54:05 2125
Python命令行之旅——深入argparse(一)作者:HelloGitHub-ProdesireHelloGitHub的《讲解开源项目》系列,项目地址:https://github.com/HelloGitHub-Team/Article前言在第一篇“初探argparse”的文章中,我们初步掌握了使用argparse的四部曲,对它有了一个基本的体感。但是它具体支持哪些类型的参数?这些参数该如何配置?本文将带你深入了解argparse的参数们。本系列文章
系统 2019-09-27 17:53:04 2125
之前介绍过python开发工具Jupyter的使用,今天继续讲解python的数据类型,python中有整型、浮点型、字符串、布尔类型,我们重点介绍布尔类型的运算,以及不同数据类型之间的转换。使用Jupyter运行的时候有两个快捷键,Shift+Enter执行本单元,并且光标会移动到下一个单元;Ctrl+Enter是执行本单元,并且光标留在本单元。在python的数据类型中,我们定义变量a=1,那么a是一个整型;定义变量b=1.2,那么b就是一个浮点型,浮
系统 2019-09-27 17:52:41 2125
为什么要做接口测试在日常开发过程中,有人做前端开发,有人负责后端开发。接口就是连接前后台,由于前端开发和后端开发的速度可能不一样,例如后端开发好了,但是前端没有开发。那么我们是不是就不需要测试呢?一般我们大部分人都是做功能测试,很多是界面的功能测试。如果你理解了接口测试,那么你就可以针对接口进行测试看看测试金字塔,接口测试是在中间部分,底层是单元测试,最顶端是界面测试。从三者的面积大小来看,单元测试和接口测试,才是重点,而界面测试真的是太少。这个面积,你可
系统 2019-09-27 17:52:16 2125
3.插入排序(简单插入排序)3.1算法思想如果有一个已经有序的数据序列,要求在这个已经排好的数据序列中插入一个数,但要求插入后此数据序列仍然有序,这个时候就要用到一种新的排序方法——插入排序法,插入排序的基本操作就是将一个数据插入到已经排好序的有序数据中,从而得到一个新的、长度增加1的有序数据。插入排序的基本思想是:每步将一个待排序的记录,按其关键码值的大小插入前面已经排序的文件中适当位置上,直到全部插入完为止。同样,这个算法不需要额外的存储空间,空间复杂
系统 2019-09-27 17:49:40 2125
1.可传入参数:@app.route('/user/')#常用的不加参数的时候默认是字符串形式的@app.route('/post/')#常用的#指定int,说明是整型的@app.route('/post/')@app.route('/post/')@app.route('/login',methods=['GET','POST'])DEFAULT_CONVERTERS={'default':UnicodeConverter,'string':Unicod
系统 2019-09-27 17:49:32 2125
importospath="./"fileType=input("文件类型:")delSubStr=input("删除串:")replaceStr=input("替换串:")forfileinos.listdir(path):suffix=os.path.splitext(file)[1]ifsuffix==fileType:newFileName=os.path.splitext(file)[0].replace(delSubStr,replaceStr
系统 2019-09-27 17:48:18 2125
PostgreSQL是一款功能强大的开源关系型数据库,本文使用python实现了对开源数据库PostgreSQL的常用操作,其开发过程简介如下:一、环境信息:1、操作系统:RedHatEnterpriseLinux4WindowsXPSP22、数据库:PostgreSQL8.33、开发工具:Eclipse+Pydev+python2.6+PyGreSQL(提供pg模块)4、说明:a、PostgreSQL数据库运行于RedHatLinux上,Windows下
系统 2019-09-27 17:47:07 2125
importsysimportimportlibimportcv2#注意python2中,直接调用reload(sys),但python3中要importimportlibimportlib.reload(sys)#获取训练好的人脸的参数数据,这里直接从GitHub上使用默认值,注意该xml文档要放在执行目录下face_cascade=cv2.CascadeClassifier('./haarcascades/haarcascade_frontalface
系统 2019-09-27 17:46:16 2125
Kmean分类项目链接:https://github.com/Wchenguang/gglearn/blob/master/KmeansClassifier/讲解/KmeansClassifier.ipynb首先,随机确定K个初始点作为质心(不必是数据中的点)。然后将数据集中的每个点分配到一个簇中,具体来讲,就是为每个点找到距其最近的质心,并将其分配该质心所对应的簇.这一步完成之后,每个簇的质心更新为该簇所有点的平均值.重复上述过程直到数据集中的所有点都距
系统 2019-09-27 17:45:38 2125
Python提供多种数据类型来存放数据项集合,主要包括序列(列表list和元组tuple),映射(如字典dict),集合(set),下面对这几种一一介绍:一序列1.列表list列表是一种有序的集合,相对于元组和字符串的不同是它其中的元素可变,可以随时添加和删除其中的元素。(1)创建list在命令行中测试,如下:>>>L1=[1,2,3]>>>L1[1,2,3]>>>L2=['abc']>>>L2['abc']>>>L3=["a","b","c"]>>>L3
系统 2019-09-27 17:38:27 2125
本文总结的是我们大家在python中常见的数据预处理方法,以下通过sklearn的preprocessing模块来介绍;1.标准化(StandardizationorMeanRemovalandVarianceScaling)变换后各维特征有0均值,单位方差。也叫z-score规范化(零均值规范化)。计算方式是将特征值减去均值,除以标准差。sklearn.preprocessing.scale(X)一般会把train和test集放在一起做标准化,或者在tr
系统 2019-09-27 17:38:06 2125
准备我测试使用的Python版本为2.7.10,如果你的版本是Python3.5的话,这里就不太适合了。使用SpeechAPI原理我们的想法是借助微软的语音接口,所以我们肯定是要进行调用相关的接口。所以我们需要安装pywin32来帮助我们完成这一个底层的交互。示例代码importwin32com.clientspeaker=win32com.client.Dispatch("SAPI.SpVoice")speaker.Speak("Hello,itwork
系统 2019-09-27 17:37:43 2125
Python是一门非常适合处理数据和自动化完成重复性工作的编程语言。我们在用数据训练机器学习模型之前,通常都需要对数据进行预处理,而Python就非常适合完成这项工作,比如需要重新调整几十万张图像的尺寸,用Python没问题!你几乎总是能找到一款可以轻松完成数据处理工作的Python库。虽然Python易于学习,使用方便,但它并非运行速度最快的语言。默认情况下,Python程序使用一个CPU以单个进程运行。如果你是在最近几年配置的电脑,通常都是四核处理器,
系统 2019-09-27 17:55:51 2124