本文地址为:http://www.cnblogs.com/kemaswill/,作者联系方式为kemaswill@163.com,转载请注明出处。机器学习的目标是学得一个泛化能力比较好的模型。所谓泛化能力,是指根据训练数据训练出来的模型在新的数据上的性能。这就牵扯到机器学习中两个非常重要的概念:欠拟合和过拟合。如果一个模型在训练数据上表现非常好,但是在新数据集上性能很差,就是过拟合,反之,如果在训练数据集和新数据集上表现都很差,就是欠拟合,如下图所示其中蓝
系统 2019-08-12 01:32:41 2287
匿名函数,顾名思义即没有名称的函数,和def定义的函数的最大区别在于匿名函数创建后返回函数本身(即匿名函数不需要return来返回值),表达式本身结果就是返回值,而def创建后则赋值给一个变量名,在Python中,我们利用关键词lambda创建匿名函数,以下是匿名函数lambda表达式的形式:lambdaarg1,arg2,.....argn:expression以下为一些lambda的特点:lambda是一个表达式,而不是一个语句,即我们可以在任何可以使
系统 2019-09-27 17:57:08 2286
前言简单介绍下python的几个自动求导工具,tangent、autograd、sympy;在各种机器学习、深度学习框架中都包含了自动微分,微分主要有这么四种:手动微分法、数值微分法、符号微分法、自动微分法,这里分别简单走马观花(helloworld式)的介绍下下面几种微分框架;sympy强大的科学计算库,使用的是符号微分,通过生成符号表达式进行求导;求得的导数不一定为最简的,当函数较为复杂时所生成的表达式树异常复杂;autograd自动微分先将符号微分用
系统 2019-09-27 17:57:01 2286
1、getitem方法使用这个方法最大的印象就是调用对象的属性可以像字典取值一样使用中括号['key']使用中括号对对象中的属性进行取值、赋值或者删除时,会自动触发对应的__getitem__、__setitem__、__delitem__方法代码如下:classFoo(object):def__init__(self):self.name='jack'def__getitem__(self,item):ifiteminself.__dict__:#ite
系统 2019-09-27 17:56:08 2286
python正则表达式转发自“Echo_fy发表于https://cloud.tencent.com/developer/article/1149679”文章目录python正则表达式1、正则解说2、中文字符集3、re模块常用方法1、正则解说数量词的贪婪模式与非贪婪模式正则表达式通常用于在文本中查找匹配的字符串。Python里数量词默认是贪婪的(在少数语言里也可能是默认非贪婪),总是尝试匹配尽可能多的字符;非贪婪的则相反,总是尝试匹配尽可能少的字符。例如:
系统 2019-09-27 17:52:59 2286
网络爬虫学习笔记(2)1资料《Python网络爬虫从入门到实践》唐松,陈志铨。主要面向windows平台下的python3。菜鸟教程-》python2笔记2-1Python基础(1)++python的列表还有一种只读格式——元组Tuple,它用()进行赋值,且只能在初始化时赋值。列表有追加元素的内置方法append()字典有内置方法keys()(获得所有键的值),values()元组用“()”标识,列表用“[]”标识,字典用“{}”标识type(变量)查看
系统 2019-09-27 17:52:48 2286
作者:chen_h微信号&QQ:862251340微信公众号:coderpai(一)机器学习中的集成学习入门(二)bagging方法(三)使用Python进行交易的随机森林算法在这篇文章中,我们将讨论什么是随机森林,他们如何工作,他们如何帮助克服决策树的局限性。随着机器学习及其技术在当前环境中的蓬勃发展,越来越多的算法在各种领域中找到应用。机器学习各个算法的工作彼此不同,其中一个算法对于某个问题可能比另一个算法更好。机器学习算法不断更新和升级,以扩大其应用
系统 2019-09-27 17:52:39 2286
有时候需要比较大的计算量,这个时候Python的效率就很让人捉急了,此时可以考虑使用numba进行加速,效果提升明显~(numba安装貌似很是繁琐,建议安装Anaconda,里面自带安装好各种常用科学计算库)fromnumbaimportjit@jitdeft(count=1000):total=0foriinrange(int(count)):total+=ireturntotal测试效果:(关于__wrapped__见我的博文:浅谈解除装饰器作用(py
系统 2019-09-27 17:50:24 2286
机器学习的三要素:模型,策略,算法模型:感知机是二分类线性分类模型,属于判别模型。策略:基于误分类点到超平面的总距离。学习算法:略感知机存在的问题:存在多解,解依赖于初始超平面的选择以及迭代过程中误分类点的选择。训练集线性不可分,算法无法收敛,解决方法:pocket算法或者使用核函数。无法解决异或问题Python代码实现:importnumpyasnpdeftrain(X_train,Y_train):print(np.shape(X_train))m,n
系统 2019-09-27 17:48:45 2286
startswith()方法检查字符串是否以str开始,任选限制匹配与给定索引的开始和结束。语法以下是startswith()方法的语法:str.startswith(str,beg=0,end=len(string));参数str--这是要检查的字符串。beg--这是可选的参数设置匹配边界的初始索引。end--这是可选的参数设置匹配边界的结束索引。返回值如果找到匹配的字符串此方法返回true,否则为false。例子下面的例子显示了startswith()
系统 2019-09-27 17:46:55 2286