Apriori代码importpandasaspd#自定义连接函数,用于实现L_{k-1}到C_k的连接defconnect_string(x,ms):"""x:频繁项集列表ms:连接符,这里用‘---’return:返回长度+1的频繁项集,即L_{k-1}到C_k的连接"""x=list(map(lambdai:sorted(i.split(ms)),x))#去除序列中的连接符,并将元素排列n=len(x[0])#每个频繁项集的长度为nr=[]forii
系统 2019-09-27 17:57:00 2083
pandas读取、写入csv数据非常方便,但是有时希望通过excel画个简单的图表看一下数据质量、变化趋势并保存,这时候csv格式的数据就略显不便,因此尝试直接将数据写入excel文件。pandas可以写入一个或者工作簿,两种方法介绍如下:1、如果是将整个DafaFrame写入excel,则调用to_excel()方法即可实现,示例代码如下:#output为要保存的Dataframeoutput.to_excel('保存路径+文件名.xlsx')2、有多个
系统 2019-09-27 17:56:47 2083
基本上,lambdas以及map,reduce和filter为python提供了函数式编程能力。让我们看看他们是什么。map:map函数采用iterable(list,tuple,set)并将函数应用于列表中的每个元素。让我们看一个例子来看看它是如何工作的。任务1:给定一个整数列表,编写代码,以方的所有数s在列表中。deffunc(num):“””对给定数字进行平方的函数“””returnnum*numl=[1,2,3,4,5,6]#map采用一个函数并应
系统 2019-09-27 17:56:26 2083
在python开发的过程中,经常会遇到需要打印各种信息。海量的信息堆砌在控制台中,就会导致信息都混在一起,降低了重要信息的可读性。这时候,如果能给重要的信息加上字体颜色,那么就会更加方便用户阅读了。当然了,控制台的展示效果有限,并不能像前段一样炫酷,只能做一些简单的设置。不过站在可读性的角度来看,已经好很多了。书写格式:开头部分:\033[显示方式;前景色;背景色m+结尾部分:\033[0m注意:开头部分的三个参数:显示方式,前景色,背景色是可选参数,可以
系统 2019-09-27 17:55:17 2083
一、变量创建过程首先,当我们定义了一个变量name='Kwan'的时候,在内存中其实是做了这样一件事:程序开辟了一块内存空间,将'Kwan'存储进去,再让变量名name指向'Kwan'所在的内存地址。如下图所示:我们可以通过id()方法查看这个变量在内存中的地址。name='Kwan'print(id(name))二、变量的修改一般我们认为修改一个变量就是用新值把就旧值覆盖掉,可Python真是这么实现的么?name='Kwan'print(id(name
系统 2019-09-27 17:54:28 2083
image花下猫语:近日,Python之父在Medium上开通了博客,并发布了一篇关于PEG解析器的文章(参见我翻的全文译文)。据我所知,他有自己的博客,为什么还会跑去Medium上写文呢?好奇之下,我就打开了他的老博客。最后一篇文章写于2018年5月,好巧不巧,写的竟是pgen解析器,正是他在新文中无情地吐槽的、说将要替换掉的pgen。在这篇旧文里,Guido回忆了他创造pgen时的一些考量,在当时看来,创造一个新的解析器无疑是明智的,只不过时过境迁,现
系统 2019-09-27 17:54:17 2083
logging库提供了两个可以用于日志滚动的class(可以参考https://docs.python.org/2/library/logging.handlers.html),一个是RotatingFileHandler,它主要是根据日志文件的大小进行滚动,另一个是TimeRotatingFileHandler,它主要是根据时间进行滚动。在实际应用中,我们通常根据时间进行滚动,因此,本文中主要介绍TimeRotaingFileHandler的使用方法(R
系统 2019-09-27 17:52:54 2083
首先,先介绍两种引入模块的方法。法一:将整个文件引入import文件名文件名.函数名()/文件名.类名通过这个方法可以运行另外一个文件里的函数法二:只引入某个文件中一个类/函数/变量需要从某个文件中引入多个函数或变量时,用逗号隔开即可from文件名import函数名,类名,变量名接下来,通过一个具体的例子说明引入模块的具体方法:假设新建一个python包test2,里边有一个名为run.py的python文件,run.py文件里有一个名为running()
系统 2019-09-27 17:51:22 2083
五,Python基础(2)1.数据类型基础(一)什么是数据类型?用于区分变量值的不同类型。(二)为何对数据分类?针对不同状态就应该用不同类型的数据去标识。(三)数据类型分类1.数字类型1.1整型(int)1.11作用表示人的年龄、各种号码、级别1.12定义age=24#age=int(24)print(id(age))print(type(age))print(age)1982099648241.13如何用加减乘除、逻辑判断(大于、小于)print(a+b
系统 2019-09-27 17:50:57 2083
时间序列数据在数据科学领域无处不在,在量化金融领域也十分常见,可以用于分析价格趋势,预测价格,探索价格行为等。学会对时间序列数据进行可视化,能够帮助我们更加直观地探索时间序列数据,寻找其潜在的规律。本文会利用Python中的matplotlib【1】库,并配合实例进行讲解。matplotlib库是一个用于创建出版质量图表的桌面绘图包(2D绘图库),是Python中最基本的可视化工具。【工具】Python3【数据】Tushare【注】示例注重的是方法的讲解,
系统 2019-09-27 17:50:03 2083