搜索到与相关的文章
Python

在Python中利用Pandas库处理大数据的简单介绍

在数据分析领域,最热门的莫过于Python和R语言,此前有一篇文章《别老扯什么Hadoop了,你的数据根本不够大》指出:只有在超过5TB数据量的规模下,Hadoop才是一个合理的技术选择。这次拿到近亿条日志数据,千万级数据已经是关系型数据库的查询分析瓶颈,之前使用过Hadoop对大量文本进行分类,这次决定采用Python来处理数据:硬件环境CPU:3.5GHzIntelCorei7内存:32GBHDDR31600MHz硬盘:3TBFusionDrive数据

系统 2019-09-27 17:50:47 2076

Python

python中update的基本使用方法详解

前言Python字典update()方法用于更新字典中的键/值对,可以修改存在的键对应的值,也可以添加新的键/值对到字典中。语法格式d.update(e)参数说明将e中键-值对添加到字典d中,e可能是字典,也可能是键-值对序列。详见实例。返回值该方法没有任何返回值。实例以下实例展示了update()方法的使用方法:d={‘one':1,'two':2}d.update({‘three':3,'four':4})#传一个字典print(d)d.update(

系统 2019-09-27 17:50:31 2076

Python

Python2.x和3.x下maketrans与translate函数使用

maketrans和translate函数是进行字符串字符编码的常用方法。本文着重点在于演示其基本用法和在不同版本下操作的差异。本文提到的2.X版本指2.6以上的版本,3.X版本指3.1以上的版本。2.X版本把字符串基本分为两种:unicode字符串和8位字符串str,后者包含字节数据和我们常见的ASCII码数据;而3.X版本则重新对字符串进行了划分,分为了字节字符串bytes和文本字符串str,两者都是不可变的,所以添加了一个可变的字节字符串类型byte

系统 2019-09-27 17:49:54 2076

Python

安装Python双版本

1.下载地址https://www.python.org/,目前版本是https://www.python.org/downloads/release/python-373/,https://www.python.org/downloads/release/python-2715/。2.依次完成v2版本和v3版本的安装,安装是勾选pip和安装环境变量。3.进入v2版本的安装目录,重命名python为python24.cmd进入v2版本的scripts目录,

系统 2019-09-27 17:49:49 2076

Python

把英雄分类,看 Python 带你上王者

王者荣耀这么久了,还没上王者?哈哈哈,看过来,是不是对英雄理解的不够透彻呢,是不是还没有很好的为英雄分类呢,今天就来看看英雄分类技术栈一、EM聚类简介二、爬取网上的英雄初始属性值三、做成饼图EM聚类简介EM英文名是ExpectationMaximization,也叫最大期望算法。在统计计算中,最大期望(EM)算法是在概率(probabilistic)模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐藏变量(LatentVari

系统 2019-09-27 17:48:38 2076

Python

Python生成随机验证码图片

思路:1、画一张白色的图片(大小为:200*50)2、逐个填充像素点,每个像素点随机3、往图片上写入字符字符随机生成字符的颜色是随机的字符的组成:大写字母、小写字母以及数字fromPILimportImage,ImageDraw,ImageFontimportnumpyasnpdefbgcolor():returnnp.random.randint(64,255),np.random.randint(64,255),np.random.randint(64

系统 2019-09-27 17:48:05 2076

Python

对python数据清洗容易遇到的函数-re.sub bytes string

re.sub功能,比replace强大的替换函数,将正则表达式匹配上的模块替换成replre.sub(pattern,repl,string,count=0,flags=0)返回最左边正则表达式限定的被repl代替的字符串,如果正则表达式没有匹配上,则字符串不做修改。\nisconvertedtoasinglenewlinecharacter,\risconvertedtoacarriagereturn,andsoforth.Unknownescapess

系统 2019-09-27 17:46:01 2076

Python

Python 列表解析

一.语法列表解析式是将一个列表(实际上适用于任何可迭代对象(iterable))转换成另一个列表的工具。在转换过程中,可以指定元素必须符合一定的条件,才能添加至新的列表中,这样每个元素都可以按需要进行转换。好处:1.简洁2.高效其实列表解析式并不是必须的,因为它能完成的工作都能够通过for循环完成,但是列表解析式比手动的for循环语句运行得更快(往往速度快一倍),因为它们的迭代在解释器内部是以C语言的速度执行的,而不是以手动的Python代码执行的,特别是

系统 2019-09-27 17:45:29 2076

Python

深入解析Python中的变量和赋值运算符

Python变量类型变量存储在内存中的值。这就意味着在创建变量时会在内存中开辟一个空间。基于变量的数据类型,解释器会分配指定内存,并决定什么数据可以被存储在内存中。因此,变量可以指定不同的数据类型,这些变量可以存储整数,小数或字符。变量赋值Python中的变量不需要声明,变量的赋值操作既是变量声明和定义的过程。每个变量在内存中创建,都包括变量的标识,名称和数据这些信息。每个变量在使用前都必须赋值,变量赋值以后该变量才会被创建。等号(=)用来给变量赋值。等号

系统 2019-09-27 17:38:21 2076

编程技术

Jboss 初级配置与部署

一.下载与安装JBoss在本文中,我们下载的JBoss版本为:4.2.1.GA。下载地址:http://sourceforge.net/project/showfiles.php?group_id=22866&package_id=16942&release_id=523619在如上的下载页中下载JBoss-4.2.1.GA.zip文件。下载完成后,将其解压缩后即可完成安装,解压缩后将其放置到一个不带空格的目录(若目录带有空格,例如:C:"ProgramF

系统 2019-08-29 23:50:12 2076