搜索到与相关的文章
Python

python 缺失值处理的方法(Imputation)

一、缺失值的处理方法由于各种各样的原因,真实世界中的许多数据集都包含缺失数据,这些数据经常被编码成空格、nans或者是其他的占位符。但是这样的数据集并不能被scikit-learn算法兼容,因为大多数的学习算法都会默认数组中的元素都是数值,因此素偶有的元素都有自己的代表意义。使用不完整的数据集的一个基本策略就是舍弃掉整行或者整列包含缺失值的数值,但是这样处理会浪费大量有价值的数据。下面是处理缺失值的常用方法:1.忽略元组当缺少类别标签时通常这样做(假定挖掘

系统 2019-09-27 17:50:59 2080

Python

在Python中利用Pandas库处理大数据的简单介绍

在数据分析领域,最热门的莫过于Python和R语言,此前有一篇文章《别老扯什么Hadoop了,你的数据根本不够大》指出:只有在超过5TB数据量的规模下,Hadoop才是一个合理的技术选择。这次拿到近亿条日志数据,千万级数据已经是关系型数据库的查询分析瓶颈,之前使用过Hadoop对大量文本进行分类,这次决定采用Python来处理数据:硬件环境CPU:3.5GHzIntelCorei7内存:32GBHDDR31600MHz硬盘:3TBFusionDrive数据

系统 2019-09-27 17:50:47 2080

Python

Python PIL图片添加字体的例子

效果左边原图,右面添加字体后保存的图。代码#-*-coding:utf-8-*-importPIL.ImageasImageimportPIL.ImageColorasImageColorimportPIL.ImageDrawasImageDrawimportPIL.ImageFontasImageFont"""author@:xunapython2.7"""#设置字体(LiberationSans-Regular.ttf这是我ubuntu16.04自带的

系统 2019-09-27 17:50:37 2080

Python

python中update的基本使用方法详解

前言Python字典update()方法用于更新字典中的键/值对,可以修改存在的键对应的值,也可以添加新的键/值对到字典中。语法格式d.update(e)参数说明将e中键-值对添加到字典d中,e可能是字典,也可能是键-值对序列。详见实例。返回值该方法没有任何返回值。实例以下实例展示了update()方法的使用方法:d={‘one':1,'two':2}d.update({‘three':3,'four':4})#传一个字典print(d)d.update(

系统 2019-09-27 17:50:31 2080

Python

Python2.x和3.x下maketrans与translate函数使用

maketrans和translate函数是进行字符串字符编码的常用方法。本文着重点在于演示其基本用法和在不同版本下操作的差异。本文提到的2.X版本指2.6以上的版本,3.X版本指3.1以上的版本。2.X版本把字符串基本分为两种:unicode字符串和8位字符串str,后者包含字节数据和我们常见的ASCII码数据;而3.X版本则重新对字符串进行了划分,分为了字节字符串bytes和文本字符串str,两者都是不可变的,所以添加了一个可变的字节字符串类型byte

系统 2019-09-27 17:49:54 2080

Python

python学习 第二天

一、运算符1、算术运算符:+-*///**%+加两个数相加1+2=3-减两个数相减3-1=2*乘两个数相乘1*2=2/除两个数相除5/2=2.5//整除两个数相除得到整数5//2=2**幂幂次方2**3=8%取余两个数的余数5%2=1(可以用来判断奇偶数取余为0的时候为偶数取余为1的时候为奇数)2、比较运算符:>、<、>=、<=、==、!=结果只有真假truefalse为bool类型3、赋值运算符:+=-=*=/=//=%=**=num+=1等价于num=

系统 2019-09-27 17:49:47 2080

Python

Python 文件操作

https://www.runoob.com/python3/python3-file-methods.htmlfile()函数用于创建一个file对象,它有一个别名叫open()1.文件打开open()函数open(file,mode=‘r’,buffering=-1,encoding=None,errors=None,newline=None,closefd=True,opener=None)file:必需,文件路径(相对或者绝对路径)。写入模式下,若

系统 2019-09-27 17:49:45 2080

Python

把英雄分类,看 Python 带你上王者

王者荣耀这么久了,还没上王者?哈哈哈,看过来,是不是对英雄理解的不够透彻呢,是不是还没有很好的为英雄分类呢,今天就来看看英雄分类技术栈一、EM聚类简介二、爬取网上的英雄初始属性值三、做成饼图EM聚类简介EM英文名是ExpectationMaximization,也叫最大期望算法。在统计计算中,最大期望(EM)算法是在概率(probabilistic)模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐藏变量(LatentVari

系统 2019-09-27 17:48:38 2080

Python

即学即用的 30 段 Python 实用代码

Python是目前最流行的语言之一,它在数据科学、机器学习、web开发、脚本编写、自动化方面被许多人广泛使用。它的简单和易用性造就了它如此流行的原因。在本文中,我们将会介绍30个简短的代码片段,你可以在30秒或更短的时间里理解和学习这些代码片段。1.检查重复元素下面的方法可以检查给定列表中是否有重复的元素。它使用了set()属性,该属性将会从列表中删除重复的元素。defall_unique(lst):returnlen(lst)==len(set(lst)

系统 2019-09-27 17:48:34 2080

Python

Python从小白到攻城狮(2)——数据类型和变量

本系列Python文章基于Python3版本,关于python的安装和配置自行百度,这里不做详细介绍。接下来将介绍Python基础——数据类型和变量。数据类型在Python中,能够直接处理的数据类型有以下几种:整型Python中可以处理任意大的整数,包括负整数。支持二进制(如0b100,换算成十进制是4)、八进制(0o100,换算成十进制是64)、十六进制(0x100,换算成十进制为256)的表示法。浮点型浮点数也就是小数,之所以称为浮点数,是因为按照科学

系统 2019-09-27 17:47:56 2080