- 军军小站|张军博客
搜索到与相关的文章
Python

Spark学习实例(Python):共享变量Shared Variables

通常在使用Spark算子函数,比如使用map()或者reduce函数我们向函数传入条件时,函数内部可以使用驱动程序中定义的变量,但是这样会使集群中所有任务都会得到变量新的副本,这些副本的更新不会传播回驱动程序,导致读写共享变量效率低下或者内存溢出,为了解决这个问题Spark提供了两种共享变量类型:广播变量和累加器广播变量:用来高效分发较大对象,只能在Driver定义,不能在Executor端定义,同时RDD不存储数据所以不能广播出去累加器:用来对信息进行聚

系统 2019-09-27 17:52:33 1905

Python

Python 运行.py文件和交互式运行代码的区别详解

代码版本:3.6.31.交互式运行代码会直接给出表达式的结果,运行代码文件必须print才能在控制台看到结果。直接给出结果:没有print是看不到结果的:有print才能看到结果:另:交互式中可以用下划线`_`来查看上一次输出的结果。如果给下划线赋值,这个效果就没了。另另:如果变量的值是空,不会显示2.交互式输出会输出原始内容,print会输出渲染后的内容打印字符串会带着引号,换行符也原样显示了。字符串的引号被去掉了,换行符真的换行了3.交互式每一句代码都

系统 2019-09-27 17:50:56 1905

Python

Centos下实现安装Python3.6和Python2共存

写在前面centos6.8中默认自带的python版本为python2.6,那么这里需要将其改为python3下载并解压官方下载地址为https://www.python.org/downloads/,这里已3.6.3为例。#下载wgethttps://www.python.org/ftp/python/3.6.3/Python-3.6.3.tgz#解压tar-zxvfPython-3.6.3.tgzcdPython-3.6.3安装[root@localh

系统 2019-09-27 17:50:51 1905

Python

13python数据分析分类算法– Knn算法 – 决策树 – 贝叶斯分类器

分类什么是分类–分类模型:输入样本的属性值,输出对应的类别,将每个样本映射到预先定义好的类别常用分类算法–Knn算法–决策树–贝叶斯分类器–支持向量机–神经网络5种算法!!分类:分为娱乐新闻、民生新闻、识别到各个类别之间的差距,对于新给的一个新闻,根据历史信息预测到它的类别有监督的学习:类别是已经确定的根据训练集数据模型的创建、模型的使用类别是给定的距离马氏距离与欧氏距离最近邻算法Knn算法主要思想:1选取k个和待分类点距离最近的样本点2看1中的样

系统 2019-09-27 17:50:33 1905

Python

[转] python 查看当前字符串的编码格式

fromhttps://blog.csdn.net/sinat_24648637/article/details/841904821.chardet模块举例2.Supportedencodingforpython1.chardet模块TheeasiestwaytousetheUniversalEncodingDetectorlibraryiswiththedetectfunction.使用通用编码检测器库的最简单方法是使用detect函数Thedetect

系统 2019-09-27 17:49:18 1905

Python

Python 的字典(Dict)是如何存储的

前言Python的字典有好多个名称("映射"、"哈希"、"散列"或者"关系数组"),那你知道为什么字典会被称为Hash(翻译为"哈希"或"散列")吗?你知道为什么字典对于键(Key)的存储数据要求比较严格,但对于对应的值(Value)的存储却要求很宽松吗?读完这篇文章,你将深刻理解这些问题背后的真相!hash首先我们来解释一下什么是Hash,来自维基百科:散列函数(或散列算法,又称哈希函数,英语:HashFunction)是一种从任何一种数据中创建小的数字

系统 2019-09-27 17:47:41 1905

Python

Python实现的二维码生成小软件

前几天,我估摸着做一个能生成QRCode小程序,并能用wxPython在屏幕上显示出来。当然,我想用纯Python实现,观望了一会后,我找到了三个候选:github上的python-qrcodesourceforge上的pyqrcodeGoolgecode上的pyqrnative我尝试了python-qrcode以及pyqrnative,因为它们能够运行在Windows/Mac/Linux。也不需要依赖额外的其他库除了Python图像库。pyqrcode项

系统 2019-09-27 17:47:37 1905

Python

python爬虫框架scrapy 豆瓣实战

Scrapy官方介绍是Anopensourceandcollaborativeframeworkforextractingthedatayouneedfromwebsites.Inafast,simple,yetextensibleway.意思就是一个开源和协作框架,用于以快速,简单,可扩展的方式从网站中提取所需的数据。环境准备本文项目使用环境及工具如下python3scrapymongodbpython3scrapy的安装就不再叙述mongodb是用来存

系统 2019-09-27 17:46:17 1905

Python

全面了解Python环境配置及项目建立

一、安装PythonPython比较稳定的两个版本是Python3.5和Python2.7,我用的是Python2.7,下载地址是:https://www.python.org/downloads/,下载之后按照正常的软件安装过程安装即可。配置Python环境变量:控制面板->系统->高级系统设置->环境变量->Path,在Path中添加python的安装路径,例如:C:\Python27;然后,一直点击确定orOK。python环境变量即配置完成,打开c

系统 2019-09-27 17:38:05 1905

Python

python爬虫之百度API调用方法

调用百度API获取经纬度信息。importrequestsimportjsonaddress=input('请输入地点:')par={'address':address,'key':'cb649a25c1f81c1451adbeca73623251'}url='http://restapi.amap.com/v3/geocode/geo'res=requests.get(url,par)json_data=json.loads(res.text)geo=j

系统 2019-09-27 17:37:51 1905