一、概论C4.5主要是在ID3的基础上改进,ID3选择(属性)树节点是选择信息增益值最大的属性作为节点。而C4.5引入了新概念“信息增益率”,C4.5是选择信息增益率最大的属性作为树节点。二、信息增益以上公式是求信息增益率(ID3的知识点)三、信息增益率信息增益率是在求出信息增益值在除以。例如下面公式为求属性为“outlook”的值:四、C4.5的完整代码fromnumpyimport*fromscipyimport*frommathimportlogim
系统 2019-09-27 17:54:47 1998
题目:1.首先将文件:/etc/selinux/config进行备份文件名为/etc/selinux/config.bak2.再文件:/etc/selinux/config中的enforcing替换为disabled#ThisfilecontrolsthestateofSELinuxonthesystem.#SELINUX=cantakeoneofthesethreevalues:#enforcing-SELinuxsecuritypolicyisenfo
系统 2019-09-27 17:53:53 1998
要求:在Python环境下用尽可能多的方法反转字符串,例如将s="abcdef"反转成"fedcba"第一种:使用字符串切片result=s[::-1]第二种:使用列表的reverse方法l=list(s)l.reverse()result="".join(l)当然下面也行l=list(s)result="".join(l[::-1])第三种:使用reduceresult=reduce(lambdax,y:y+x,s)第四种:使用递归函数deffunc(s
系统 2019-09-27 17:53:05 1998
手写代码实现基于信息熵划分的决策树算法文章目录手写代码实现基于信息熵划分的决策树算法1.简介2.算法实现思路3.代码如下参考1.简介阅读本文需要以下背景知识:-掌握周志华《西瓜书》第四章决策树原理-Python3.0基础语法及数据类型及操作不了解决策树请点击下面链接西瓜书第四章决策树学习笔记本文是基于信息熵准则进行划分选择的决策树算法的手写实现,不使用现有的机器学习包。算法流程见《西瓜书》第四章第一节。数据集使用西瓜数据集3.0(数据集在代码中不需要另外下
系统 2019-09-27 17:53:01 1998
如果有了解过python中的列表和元组,你可能会知道相对于列表,元组是不可变的,也就是说元组中的数据不能随意更改。除了列表是用中括号表示而元组是用小括号表示之外,这两种数据类型好像并没有什么不同,都是用来存放一系列的数据,事实真是如此吗?a=[1,3,5,7,'a']b=(1,3,5,7,'b')#现在改变b中的值b[2]=4TypeErrorTraceback(mostrecentcalllast)in()45#现在改变b中数据的值---->6b[2]=
系统 2019-09-27 17:52:59 1998
A:西米喜欢健身B:超超不爱健身,喜欢打游戏step1:分词A:西米/喜欢/健身B:超超/不/喜欢/健身,喜欢/打/游戏step2:列出两个句子的并集西米/喜欢/健身/超超/不/打/游戏step3:计算词频向量A:[1,1,1,0,0,0,0]B:[0,1,1,1,1,1,1]step4:计算余弦值余弦值越大,证明夹角越小,两个向量越相似。step5:python代码实现importjiebaimportjieba.analysedefwords2vec(
系统 2019-09-27 17:52:29 1998
本例使用QQ邮箱测试,需要打开QQ邮箱的smtp协议,获取授权码代码内容如下:#!/usr/bin/envpython#_*_coding:utf-8_*___author__='junxi'importsmtplibfromemail.mime.textimportMIMEText#文本模式#msg=MIMEText('sendbypython...','plain','utf-8')#html格式msg=MIMEText('Hello'+'sendby
系统 2019-09-27 17:51:26 1998
最近在弄flask的东西,好久没写博客的,感觉少了点什么,感觉被别人落下好多,可能渐渐的养成了写博客的习惯吧。也是自己想学的东西太多了(说白了就是基础太差了,只是knowhow,不能做到konwwhy)。不说那些毒鸡汤了,我们来说说我们今天的python基础面试题吧。一,Q:python的优缺点有什么?A:优点:1,基础语法简单易学,对于初学者来说,语法还是相对简单的,比较容易学习,网上的学习资料也很多。2,面向对象,在python里继承和封装较多,而py
系统 2019-09-27 17:50:49 1998
ndarray.ndim:维度ndarray.shape:形状ndarray.size:元素个数ndarray.dtype:元素数据类型ndarray.itemsize:字节大小创建数组:a=np.array([2,23,4])#list1dprint(a)#[2234]指定数据类型:a=np.array([2,23,4],dtype=np.int)print(a.dtype)#int64dtype可以指定的类型有int32,float,float32,后
系统 2019-09-27 17:50:47 1998
面向对象---谁来做?相比函数,面向对象是一个更大的封装,根据职责在一个对象中封装多个方法。在完成某个需求前,首先确定职责--要做的事情(方法)根据职责确定不同的对象,在对象内部封装不同的方法最后完成代码,就是顺序的让不同的对象调用不同的方法。特点:注重对象和职责,不同的对象承担不同的职责。更加适合应对对复杂需求的变化,是专门应对复杂项目开发,提供的固定套路。面向对象的两个核心概念:类和对象类的定义:是对一群具有相同特征(属性)或者行为(方法)的事物的一个
系统 2019-09-27 17:50:07 1998