1.过拟合定义+处理1.1过拟合概述(低偏差,高方差)定义:过拟合简单的描述就是在训练集上的表现很好,但在未见过的测试集上的表现却较差。专业一点的定义就是:给定一个假设空间H,一个假设h属于H,如果存在其他的假设h'也属于H,使得在训练样例上h的错误率小于h',但是在整个实例分布上h'比h的错误率小,那么则称假设h过度拟合训练数据。危害:一个过拟合的模型试图连“误差”都去解释,而实际上噪音是不需要解释的,这个解释的过程导致模型的泛化能力较差,模型在预测集上
系统 2019-09-27 17:51:55 2533
前言众所周知,python拥有丰富的内置库,还支持众多的第三方库,被称为胶水语言,随机函数库random,就是python自带的标准库,他的用法极为广泛,除了生成比较简单的随机数外,还有很多功能。使用random库:importrandomrandom库主要函数:函数名说明用法random()生成一个0~1之间的随机浮点数,范围0<=n<1.0random.random()uniform(a,b)返回a,b之间的随机浮点数,范围[a,b]或[a,b),取决
系统 2019-09-27 17:51:33 2533
谈到比特币,我们都知道挖矿,有些人并不太明白挖矿的含义。这里的挖矿其实就是哈希的碰撞,举个简单例子:importhashlibx=11y=1#这里可以调节挖矿难度,也就是哈希的长度whilehashlib.sha256(f'{x*y}'.encode("utf-8")).hexdigest()[5:7]!="00":print(x*y)y+=1print("找到了:",(x*y))结果如下:当然比特币的挖矿要比这个复杂太多,但是原理差不多,有个大概的认知。
系统 2019-09-27 17:49:39 2533
本文实例为大家分享了三种方式使用python写数据到csv或xlsx文件,供大家参考,具体内容如下第一种:使用csv模块,写入到csv格式文件#-*-coding:utf-8-*-importcsvwithopen("my.csv","a",newline='')asf:writer=csv.writer(f)writer.writerow(["URL","predict","score"])row=[['1',1,1],['2',2,2],['3',3,
系统 2019-09-27 17:49:35 2533
小编想把用python将列表[1,1,1,1,1,1,1,1,1,1]和列表[2,2,2,2,2,2,2,2,2,2]对应相加成[3,3,3,3,3,3,3,3,3,3]。代码如下:importnumpya=numpy.array([1,1,1,1,1,1,1,1,1,1])b=numpy.array([2,2,2,2,2,2,2,2,2,2])c=a+bprint(type(c))print(list(c))输出结果为:[3,3,3,3,3,3,3,3,
系统 2019-09-27 17:47:35 2533
前言APScheduler是基于Quartz的一个Python定时任务框架。提供了基于日期、固定时间间隔以及crontab类型的任务,并且可以持久化任务。在线文档:https://apscheduler.readthedocs.io/en/latest/userguide.html一、安装APSchedulerpipinstallapscheduler二、基本概念APScheduler有四大组件:1、触发器triggers:触发器包含调度逻辑。每个作业都有
系统 2019-09-27 17:46:59 2533
Python自带的IDE是IDLE,最简单不过,但是全国二级要求使用该IDE。该IDE相对于其他更高级的IDE,例如PyCharm和VisualStudioCode等,功能明确弱得很。但是,就应对二级Python考试来说已经绰绰有余。问题在其内置的命令行环境下现遇到一个小问题是:反斜杠显示为人民币符号¥,无论当前输入法是中文还是英文输入法。参考下图:分析与解决办法经过试验发现,可以通过菜单命令“Options”-“ConfigureIDLE”,把当前编辑环
系统 2019-09-27 17:55:32 2532
1.获取两个list的交集#-*-coding=utf-8-*-#方法一:a=[2,3,4,5]b=[2,5,8]tmp=[valforvalinaifvalinb]printtmp#[2,5]#方法二printlist(set(a).intersection(set(b)))2.获取两个list的并集printlist(set(a).union(set(b)))3.获取两个list的差集printlist(set(b).difference(set(a)
系统 2019-09-27 17:52:32 2532
列表列表是内建的数据结构,用来存储一系列元素。列表与字符串相同点:都支持索引([]运算符)、切片([:])、拼接(+)、重复(*)、成员(in运算符)、长度(len()函数)和循环(for)操作。不同点:列表使用[]生成,元素之间用逗号分离,字符串使用成对引号生成;列表可以包含多种类型的对象,字符串只能是字符;列表的内容是可变的,字符串一旦生成就不可变。列表的可变性可以对列表中的任意元素进行重新赋值,如:lst[0]=‘a’可以通过切片操作对子列表进行赋值
系统 2019-09-27 17:49:26 2532
声音的本质是震动,震动的本质是位移关于时间的函数,波形文件(.wav)中记录了不同采样时刻的位移。通过傅里叶变换,可以将时间域的声音函数分解为一系列不同频率的正弦函数的叠加,通过频率谱线的特殊分布,建立音频内容和文本的对应关系,以此作为模型训练的基础。案例:画出语音信号的波形和频率分布,(freq.wav数据地址)#-*-encoding:utf-8-*-importnumpyasnpimportnumpy.fftasnfimportscipy.io.wa
系统 2019-09-27 17:49:15 2532
描述ceil(x)函数返回一个大于或等于x的的最小整数。语法以下是ceil()方法的语法:importmathmath.ceil(x)注意:ceil()是不能直接访问的,需要导入math模块,通过静态对象调用该方法。参数x--数值表达式。返回值函数返回返回一个大于或等于x的的最小整数。实例以下展示了使用ceil()方法的实例:#!/usr/bin/python3importmath#导入math模块print("math.ceil(-45.17):",ma
系统 2019-09-27 17:38:17 2532
添加键值对首先定义一个空字典>>>dic={}直接对字典中不存在的key进行赋值来添加>>>dic['name']='zhangsan'>>>dic{'name':'zhangsan'}如果key或value都是变量也可以用这种方法>>>key='age'>>>value=30>>>dic[key]=value>>>dic{'age':30,'name':'zhangsan'}这里可以看到字典中的数据并不是按先后顺序排列的,如果有兴趣,可以搜一搜数据结构中
系统 2019-09-27 17:38:13 2532
具体内容如下:1os.system例如ipython中运行如下命令,返回运行状态statusos.system('cat/etc/passwdqc.conf')min=disabled,24,11,8,7max=40passphrase=3match=4similar=denyrandom=47enforce=everyoneretry=3Out[6]:02os.popen()popen(command[,mode='r'[,bufsize]])->pip
系统 2019-09-27 17:38:06 2532
一、K近邻算法概念K近邻(k-NearestNeighbor,简称kNN)学习是一种或常用的监督学习方法,其工作机制非常简单:给定测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练样本,然后基于这k个“邻居”的信息来进行预测。通常,在分类任务中可使用“投票法”,即选择这k个样本中出现最多的类别标记作为预测结果;在回归任务中可使用“平均法”,即将这k个样本的实质输出标记的平均值作为预测结果;还可基于距离远近进行加权平均或者加权投票,距离越近的样本权重
系统 2019-09-27 17:57:18 2531
Python爬取mm131图片写在前面的话爬虫第一步安装python环境爬取图片要用到的三方库创建一个py文件代码运行遇到的过的问题写在后面的话写在前面的话说起来来写爬虫这件事,不是心血来潮。我最近想让自己的网站流量提升一下,所以就想着能不能搞点美女图片来提高一下点击量。一开始我是直接使用了干货api里面的美女图片接口在自己的网站上展示图片,这样一来我服务器的带宽压力会小很多,毕竟小水管服务器压力还是蛮大的(阿里云服务器最低配置),后来使用发现,这个api
系统 2019-09-27 17:54:01 2531