搜索到与相关的文章
Python

python时间序列按频率生成日期的方法

有时候我们的数据是按某个频率收集的,比如每日、每月、每15分钟,那么我们怎么产生对应频率的索引呢?pandas中的date_range可用于生成指定长度的DatetimeIndex。我们先看一下怎么生成日期范围:pd.date_range(startdate,enddate)1.生成指定开始日期和结束日期的时间范围:In:importpandasaspdindex=pd.date_range('4/1/2019','5/1/2019')print(inde

系统 2019-09-27 17:56:20 2181

Python

【Python】DataFrame使用drop_duplicates()函数

摘要在进行数据分析时,我们经常需要对DataFrame去重,但有时候也会需要只保留重复值。这里就简单的介绍一下对于DataFrame去重和取重复值的操作。创建DataFrame这里首先创建一个包含一行重复值的DataFrame。DataFrame去重,可以选择是否保留重复值,默认是保留重复值,想要不保留重复值的话直接设置参数keep为False即可。3.取DataFrame重复值。大多时候我们都是需要将数据去重,但是有时候很我们也需要取重复数据,这个时候我

系统 2019-09-27 17:56:02 2181

Python

python多进程——fork()

简介程序每次执行时,操作系统都会创建一个新进程来运行程序指令。进程中可调用os.fork,要求操作系统新建一个子进程.[Windowsc系统中,os模块没有os.fork函数]。每个进程都有一个不重复的进程ID号。或称pid,它对进程进行标识。子进程与父进程完全相同,子进程从父进程继承了多个值的拷贝。如全局变量和环境变量。fork后,子进程接收返回值0,而父进程接收子进程的pid作为返回值os.fork()Forkachildprocess.Return0

系统 2019-09-27 17:55:42 2181

Python

Python中正则表达式详解

基础篇正则表达式在python中运用的非常多,因为他可以进行任意的匹配,可以匹配我们想要提取的信息。当我们接触正则的时候你就会知道正则的强大。正则有一个库re在一些工程中我们会经常调用正则的库来做与匹配相关的问题。字符串是编程时涉及到的最多的一种数据结构,对字符串进行操作的需求几乎无处不在。比如判断一个字符串是否是合法的Email地址,虽然可以编程提取@前后的子串,再分别判断是否是单词和域名,但这样做不但麻烦,而且代码难以复用。正则表达式是一种用来匹配字符

系统 2019-09-27 17:55:32 2181

Python

Python函数参数匹配模型(上)

概述Python3中函数参数一般都是通过赋值进行传递的,而调用者只需要知道如何正确的传递参数即可直接使用函数,位置参数即我们使用最频繁的参数传递方法,通过参数的默认位置从左到右进行匹配deff(x,y,z):print(x,y,z)f(1,2,3)示例结果:123关键词参数我们可以通过函数参数关键字进行参数传递,此时参数的传递是通过变量名匹配,而不是位置的方式匹配,所以在我们在使用混合的基于位置的参数和基于关键字的参数传递的原则就是,先基于位置的参数从左到

系统 2019-09-27 17:55:29 2181

Python

很多企业开发语言从Python 转向了 Golang的原因

​很多企业开发语言从Python转向了Golang的原因​因为原生Python的性能真的是太捉襟见肘了。单机运行计算型任务,速度慢是有目共睹的。IO型人物不涉及多线程(比如用协程)的还好,一旦涉及到多线程,立刻懵逼。比如,你开个Python线程,让它sleep5秒,再开第二个线程,随便算个fibonacci或者直接写个busyloop,你就会发现你的程序实际上会sleep6秒。想突破也不难,用pybinding11写c++,再用python调用。但都这样了

系统 2019-09-27 17:54:29 2181

Python

Spark学习实例(Python):共享变量Shared Variables

通常在使用Spark算子函数,比如使用map()或者reduce函数我们向函数传入条件时,函数内部可以使用驱动程序中定义的变量,但是这样会使集群中所有任务都会得到变量新的副本,这些副本的更新不会传播回驱动程序,导致读写共享变量效率低下或者内存溢出,为了解决这个问题Spark提供了两种共享变量类型:广播变量和累加器广播变量:用来高效分发较大对象,只能在Driver定义,不能在Executor端定义,同时RDD不存储数据所以不能广播出去累加器:用来对信息进行聚

系统 2019-09-27 17:52:33 2181

Python

python 各层级目录下的import方法

---恢复内容开始---以前经常使用python2.现在很多东西都切换到了python3,发现很多东西还是存在一些差异化的。跨目录import是常用的一种方法,并且有不同的表现形式,新手很容易搞混。有必要这里做个总结,给大家科普一下:1同级目录下的调用:同级目录下的调用比较简单,一般使用场景是不同类的相互调用。不用考虑路径问题,常用的格式是:fromfileimport*或者fromfileimportclass/function等。下面以一个例子作为说明

系统 2019-09-27 17:52:20 2181

Python

弄懂这56个Python使用技巧(轻松掌握Python高效开发)

1.枚举-enumerate可以有参数哦之前我们这样操作:i=0foriteminiterable:printi,itemi+=1现在我们这样操作:fori,iteminenumerate(iterable):printi,itemenumerate函数还可以接收第二个参数。就像下面这样:>>>list(enumerate('abc'))[(0,'a'),(1,'b'),(2,'c')]>>>list(enumerate('abc',1))[(1,'a')

系统 2019-09-27 17:52:08 2181

Python

python 手码实现朴素贝叶斯二分类无框架

数据集:https://archive.ics.uci.edu/ml/datasets/Adult这个数据集是字符数据集,你需要自己进行清洗数据转换数据之类的,好在python的字符串操作特别简单,好处理。特征取了学位情况、工作职业性质、工作单位之类的。朴素贝叶斯:https://www.bilibili.com/video/av36338359?from=search&seid=1177086802297258225这个的数据集是预测一个人的年薪是否能超

系统 2019-09-27 17:52:08 2181