前言ApacheSpark是一个新兴的大数据处理通用引擎,提供了分布式的内存抽象。Spark最大的特点就是快,可比HadoopMapReduce的处理速度快100倍。本文没有使用一台电脑上构建多个虚拟机的方法来模拟集群,而是使用三台电脑来搭建一个小型分布式集群环境安装。本教程采用Spark2.0以上版本(比如Spark2.0.2、Spark2.1.0等)搭建集群,同样适用于搭建Spark1.6.2集群。安装Hadoop并搭建好Hadoop集群环境Spark
系统 2019-09-27 17:47:31 2602
kruskal(克鲁斯卡尔)的思路很直观,边按权值从小到大排序,然后从小到大选不会构成回路的边,构成生成树。(选两点不在同一个连通分量里面的边)构建并查集,用并查集判断是否构成回路(是否在同一个分量里面)(两个连通分量如果根结点相同,两点连接就会构成回路)python代码:deffind(x,pres):"""查找x的最上级(首级):paramx:要查找的数:parampres:每个元素的首级:return:根结点(元素的首领结点)"""root,p=x,
系统 2019-09-27 17:56:12 2601
leaflet为R语言提供了API很好用,这次尝试用Python使用leaflet,需要folium安装foliumpipinstallfolium一个小例子importfoliumimportreinput=open('C:\\Users\\Administrator\\Desktop\\a.txt','r')text=input.read()list=re.split('\n',text)location=[]forelementinlist:loca
系统 2019-09-27 17:47:53 2601
任务要求:1.随机生成1~100的数字2.有5次机会3.如果输入结果小于系统随机数,则打印toosmall4.如果输入结果大于系统随机数,则打印toobig5.如果猜测正确【输入结果等于系统随机数】,则打印:恭喜,并退出循环考查内容:while循环和if判断的综合应用实现代码:#猜数字游戏i=1importrandomSuiJiShu=int(random.randint(1,100))whilei<=5:i+=1GuessNum=int(input('请
系统 2019-09-27 17:56:02 2600
K-Means是一种聚类算法,无参照物,没有训练数据。该算法的原理:有一群杂乱无章的点,分布混乱,现在规定把这些点分成K类,首先找到这K类的中心店,然后选择一个距离(欧氏距离、曼哈顿距离、切比雪夫距离等),计算各点到各中心点之间的距离,离哪个中心店近就划分到该中心店所属的类中。重复上述操作,直到类不发生变化,或者你也可以设置最大迭代次数,这样即使类中心点发生变化,但是只要达到最大迭代次数就会结束。下面通过一个实例:利用python给亚洲球队做聚类分析(以下
系统 2019-09-27 17:56:40 2599
使用python作为TCP服务端物联网应用说明因公司自主研发的电哒哒智慧能量柜需要通过TCP与服务器进行通讯,机柜定时传输硬件设备信息,用户扫码后通过服务端下发“租/还”命令,控制机柜开关锁等。服务端通过pymysql直连数据库操作仅做为项目记录,供参考勿喷附上完整代码importsocketserverimport_threadimporttimeimportloggingfromthreadingimportThreadfrombaseimportba
系统 2019-09-27 17:55:25 2598
#嵌套json/dict排序defdict_ordered(obj):ifisinstance(obj,dict):returnsorted((k,dict_ordered(v))fork,vinobj.items())ifisinstance(obj,list):returnsorted(dict_ordered(x)forxinobj)else:returnobj#递归删除json/dict中的某个值defdict_del(key,obj):ifisi
系统 2019-09-27 17:53:22 2598
可以使用numpy中的linspace函数np.linspace(start,stop,num,endpoint,retstep,dtype)#start和stop为起始和终止位置,均为标量#num为包括start和stop的间隔点总数,默认为50#endpoint为bool值,为False时将会去掉最后一个点计算间隔#restep为bool值,为True时会同时返回数据列表和间隔值#dtype默认为输入变量的类型,给定类型后将会把生成的数组类型转为目标类
系统 2019-09-27 17:48:43 2598
1调试过程用Python3.6+Sciter+PyCharm写了一个py测试脚本helloworld.py,该脚本中只含有一条语句“importsciter”。在PyCharm中运行之,未报错。#helloworld.pyimportsciter然后将该脚本用PyInstaller打包成exe文件,打包程序pack.py如下:#pack.pyfromPyInstaller.__main__importrunif__name__=='__main__':op
系统 2019-09-27 17:52:27 2597
图像的几何变换imgobj=cv2.imread('pho.png')#读取图像cv2.namedWindow("image")#创建窗口并显示的是图像类型cv2.imshow("image",imgobj)cv2.waitKey(0)#等待事件触发,参数0表示永久等待cv2.destroyAllWindows()#释放窗口#resizeres=cv2.resize(imgobj,None,fx=0.5,fy=0.5,interpolation=cv2.I
系统 2019-09-27 17:49:23 2597
使用Python来进行文件的分割与合并是非常简单的。python代码如下:splitFile--将文件分割成大小为chunksize的块;mergeFile--将众多文件块合并成原来的文件;#coding=utf-8importos,sysreload(sys)sys.setdefaultencoding('UTF-8')classFileOperationBase:def__init__(self,srcpath,despath,chunksize=10
系统 2019-09-27 17:57:19 2596
我们通过一个简单的事例来展示一下函数的万能参数,我们先写一个最简单的函数deftest(*args,**kwargs):print(args,kwargs)然后定义两个变量l=[1,2,3,4]d={"a":1,"b":2}下面我们分别看下两种传参的方式有什么不同第一种方式test(l,d)如果是使用上面的方式传参,那么l,d这2个变量都会传递给args这个形参,作为args变量的两个元素,kwargs是一个空的字典,没有任何参数传递一个他([1,2,3,
系统 2019-09-27 17:56:13 2596
本文实例为大家分享了Python通过cv2读取多个USB摄像头的具体代码,供大家参考,具体内容如下通过cv2可以轻易的拿到摄像头数据。比如以下几步就能打开摄像头显示,并通过q键保存图片importcv2capture=cv2.VideoCapture(0)#打开自带的摄像头ifcapture.isOpened():#以下两步设置显示屏的宽高capture.set(cv2.CAP_PROP_FRAME_WIDTH,640)capture.set(cv2.CA
系统 2019-09-27 17:45:38 2596
1.实现功能编写python脚本一直运行,判断当下是否是新的一天,如果是就执行一次任务代码2.具体实现代码#-*-coding:utf-8-*-__author__='Administrator'importos,threading,timecurTime=time.strftime("%Y-%M-%D",time.localtime())#记录当前时间execF=Falsencount=0defexecTask():#具体任务执行内容print("exe
系统 2019-09-27 17:56:39 2595
importrequestsimportjsonfromtkinterimportTk,Button,Entry,Label,Text,ENDclassYouDaoFanyi(object):def__init__(self):passdefcrawl(self,word):url='http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'#使用post需要一个链接data={
系统 2019-09-27 17:54:05 2595