上面我们学习了RDD如何转换,即一个RDD转换成另外一个RDD,但是转换完成之后并没有立刻执行,仅仅是记住了数据集的逻辑操作,只有当执行了Action动作之后才会真正触发Spark作业,进行算子的计算执行操作有:reduce(func)collect()count()first()take(n)takeSample(withReplacement,num,[seed])takeOrdered(n,[ordering])saveAsTextFile(path
系统 2019-09-27 17:52:33 1964
和很多语言一样,Python中也分为简单赋值、浅拷贝、深拷贝这几种“拷贝”方式。在学习过程中,一开始对浅拷贝理解很模糊。不过经过一系列的实验后,我发现对这三者的概念有了进一步的了解。一、赋值赋值算是这三种操作中最常见的了,我们通过一些例子来分析下赋值操作:str例复制代码代码如下:>>>a='hello'>>>b='hello'>>>c=a>>>[id(x)forxina,b,c][4404120000,4404120000,4404120000]由以上指
系统 2019-09-27 17:51:51 1964
Socket是网络应用的基础。而Python使得网络socket编程入门变得超级简单。在这篇简介里面我们将创建一个简单服务器,用于接受和相应客户端程序的请求。由于本人最近对LinuxContainers有点痴迷,因此我们也将在服务器中实现2个容器。同时在容器中我们在几秒钟内就能创建其他一些主机,这就能非常简单的模拟出一个网络。创建容器我使用的是Ubuntu14.04.然后用root用户运行下面的命令就可以创建好2个容器了。复制代码代码如下:lxc-crea
系统 2019-09-27 17:51:21 1964
最近刚好有朋友遇到个global相关的问题,这里简单学习一下global关键字的用法。想要更好的了解global关键字,首先要熟悉python的全局变量与局部变量的概念。global关键字的作用是可以申明一个局部变量为全局变量,下面看一下实例一、变量作用域的说明这里简单提一下变量作用域的概念,有兴趣的小伙伴,可以查一下相关的博客1、局部变量defa():##菊部变量-,-local=1print(local)##全局无法使用,只有自己可用print(lob
系统 2019-09-27 17:51:01 1964
1.reload()函数Python2:reload()函数封装在sys模块中,使用时:importsysreload()Python3:reload()不再封装在sys模块中,而是importlib,使用方式如下:importimportlibimportyourfilereload('yourfile')注意:使用reload()函数时需要import你的文件参考文章:https://blog.csdn.net/heifan2014/article/d
系统 2019-09-27 17:50:49 1964
什么是变量:用来绑定数据对象的标识符一.变量的命名规则:变量名必须为字母或下划线开头,后跟字母或下划线或数字不能使用python的关键字命名命名规则可以被视为一种惯例,并无绝对与强制目的是为了增加代码的识别和可读性在定义变量时,为了保证代码格式,=的左右应该各保留一个空格在Python中,如果变量名需要由二个或多个单词组成时,可以按照以下方式命名每个单词都使用小写字母单词与单词之间使用_下划线连接例如:first_name、ast_name、qq_numb
系统 2019-09-27 17:50:41 1964
前言一个偶然的机会来到博客园,看到了vamei的博文,瞬间被大神言简意赅,深入浅出的Python快速课程所吸引,开始了一步一步的学习编程之路。同时也惊闻大神因抑郁症去世,真是天妒英才,感慨万千。有兴趣的可以看看大神生前的文章。https://www.cnblogs.com/vamei/archive/2012/09/13/2682778.html第一课Python的优缺点以及干什么用的,想必大家都很了解。主要有:简单易学,功能强大,可移植性强等,是人工智能
系统 2019-09-27 17:49:54 1964
importpandasaspdfromsklearnimportdatasetsimportmatplotlib.pyplotaspltimportmatplotlib.cmfromsklearn.model_selectionimporttrain_test_splitfromsklearn.neighborsimportKNeighborsClassifierdig=datasets.load_digits()#读入sklearn内置数据print(
系统 2019-09-27 17:49:24 1964
脚本如下:fromopenpyxlimportload_workbookworkbook=load_workbook(u'/tmp/test.xlsx')#找到需要xlsx文件的位置booksheet=workbook.active#获取当前活跃的sheet,默认是第一个sheet#如果想获取别的sheet页采取下面这种方式,先获取所有sheet页名,在通过指定那一页。#sheets=workbook.get_sheet_names()#从名称获取shee
系统 2019-09-27 17:48:59 1964
9.5守护进程主进程创建守护进程其一:守护进程会在主进程代码执行结束后就立即终止其二:守护进程内无法再开启子进程,否则抛出异常:AssertionError:daemonicprocessesarenotallowedtohavechildren注意:进程之间是互相独立的,主进程代码运行结束,守护进程随即终止p.daemon:默认值为False,如果设为True,代表p为后台运行的守护进程,当p的父进程终止时,p也随之终止,并且设定为True后,p不能创建
系统 2019-09-27 17:48:24 1964