概述降维是机器学习中十分重要的一种思想。在机器学习中,我们会经常处理一些高维数据,而高维数据情形下,会出现距离计算困难,数据样本稀疏等问题。这类问题是所有机器学习方法共同面临的问题,我们也称之为“维度灾难”。在高维特征中,也容易出现特征之间存在线性相关,也就是说有的特征是冗余的,因此降维也是必要的。降维的优点(必要性):去除噪声降低算法的计算开销(改善模型的性能)使得数据更容易使用使得数据更容易理解(几百个维度难以理解,几个维度可视化易理解)降维的方法有很
系统 2019-09-27 17:47:48 2455
今天继续爬取一个网站,http://www.27270.com/ent/meinvtupian/这个网站具备反爬,所以我们下载的代码有些地方处理的也不是很到位,大家重点学习思路,有啥建议可以在评论的地方跟我说说。为了以后的网络请求操作方向,我们这次简单的进行一些代码的封装操作。这里在你可以先去安装一个叫做retrying的模块pipinstallretrying这个模块的具体使用,自己去百度吧。嘿嘿哒〜在这里我使用了一个随机产生USER_AGENT的方法i
系统 2019-09-27 17:57:21 2454
%matplotlibinline#支持向量机SVM的核函数importnumpyasnpimportmatplotlib.pyplotaspltfromsklearnimportsvmfromsklearn.datasetsimportmake_blobsX,y=make_blobs(n_samples=50,centers=2,random_state=6)print('X:\n',X,'\n')print('y:\n',y,'\n')X:[[6.45
系统 2019-09-27 17:56:57 2454
继承什么是继承继承是一种创建新类的方式,在python中,新建的类可以继承一个或多个父类,父类又可称为基类或超类,新建的类称为派生类或子类python中类的继承分为:单继承和多继承classParentClass1:#定义父类passclassParentClass2:#定义父类passclassSubClass1(ParentClass1):#单继承,基类是ParentClass1,派生类是SubClasspassclassSubClass2(Paren
系统 2019-09-27 17:56:44 2454
最近想用python对数据集进行数据预处理,想要分析系统调用之间的关系。初步想法是利用n-gram方法,因此查询到了python的sklearn中有一个CountVectorizer方法可以使用,在这里介绍一下这个函数的使用方法,以及其输出的相关含义。0x01输入及输出fromsklearn.feature_extraction.textimportCountVectorizer#fromsklearn.feature_extraction.textimp
系统 2019-09-27 17:56:23 2454
Rust也能实现神经网络?作者|NathanJ.Goldbaum译者|弯月,责编|屠敏出品|CSDN(ID:CSDNnews)以下为译文:我在前一篇帖子(http://neuralnetworksanddeeplearning.com/chap1.html)中介绍了MNIST数据集(http://yann.lecun.com/exdb/mnist/)以及分辨手写数字的问题。在这篇文章中,我将利用前一篇帖子中的代码,通过Rust实现一个简单的神经网络。我的目
系统 2019-09-27 17:52:04 2454
本文实例讲述了Python函数的定义和作用域。分享给大家供大家参考,具体如下:定义函数默认参数:可以向函数中添加默认参数,以便为在函数调用中未指定的参数提供默认值#如果调用cylinder_volume函数时,不提供radius参数,那么radius的值为5defcylinder_volume(height,radius=5):pi=3.14159returnheight*pi*radius**2向函数中的参数传值的方法:按照位置和按照名称cylinder
系统 2019-09-27 17:57:35 2453
最近在做一个很大的数据库方面的东东,要用到根据数值来查找,于是想到了python中的字典,平时没用过dict这个东东用的最多的还是list和tuple(网上查用法一大堆)看了一下创建字典的方法:方法1:dict={'name':'earth','port':80}方法2:fdict=dict((['x',1],['y',2]))方法3:ddict={}.fromkeys(('x','y'),-1)都实验了一下这些方法,发现不好用,做不出来自己想要的结果,因
系统 2019-09-27 17:56:52 2453
python3安装:一:安装过程安装包:wgethttps://www.python.org/ftp/python/3.7.0/Python-3.7.0.tgztar-xvfPython-3.7.0.tgz#解压基础包1、基础yum包yuminstallgccyuminstallzlibyuminstallzlib-develyuminstalllibffi-devel-yyuminstallopensslopenssl-devel-y检测平台:(需要首先
系统 2019-09-27 17:45:26 2453
Smptp类定义:smtplib.SMTP(host[,port[,local_hostname[,,timeout]]]),作为SMTP的构造函数,功能是与smtp服务器建立连接,在连接成功后,就可以向服务器发送相关请求,比如登陆,校验,发送,退出等。host参数为远程smtp主机地址,比如stmp.163.com;port为连接端口,默认为25;local_hostname的作用是在本地的FQDN(完整的域名)发送HELO/EHLO指令,timeout
系统 2019-09-27 17:38:37 2453
原文链接:https://blog.csdn.net/sinat_15274667/article/details/51378882python文件的后缀名是.py,python文件既可以用来直接执行,也可以作为模块被导入。我们在使用python时经常会看到ifname==‘main‘:这样一个句子,这是什么呢?其中name是模块的内置属性,而这个内置属性的值取决于这个.py文件的使用方式,即你是作为模块导入还是直接执行。如果你是直接执行,那么这个name
系统 2019-09-27 17:55:52 2452
我们经常使用傅里叶变换来计算数字信号的频谱,进而分析数字信号,离散时间傅里叶变换的公式为:可是自己动手实现一遍才是最好的学习。在数字分析里面,傅里叶变换默认等时间间隔采样,不需要时间序列,只需要信号数组即可分析。分析过程如下:对于含有n个样本值的数字信号序列,根据奈奎斯特采样定律,包含的周期数最大为n/2,周期数为0代表直流分量。所以,当周期数表示为离散的0,1,2,3…n/2,总的数目为n/2+1个傅里叶变换之后的结果为复数,下标为k的复数a+b*j表示
系统 2019-09-27 17:54:43 2452
前言提起selenium想必大家都不陌生,作为一款知名的Web自动化测试框架,selenium支持多款主流浏览器,提供了功能丰富的API接口,经常被我们用作爬虫工具来使用。但是selenium的缺点也很明显,比如速度太慢、对版本配置要求严苛,最麻烦是经常要更新对应的驱动。今天就给大家介绍另一款web自动化测试工具Pyppeteer,虽然支持的浏览器比较单一,但在安装配置的便利性和运行效率方面都要远胜selenium。01.Pyppeteer简介介绍Pypp
系统 2019-09-27 17:53:10 2452
PyQtGraph是Python平台上一种功能强大的2D/3D绘图库,相对于matplotlib库,由于其在内部实现方式上,使用了高速计算的numpy信号处理库以及Qt的GraphicsView框架,因此它在大数据量的处理及快速显示方面有着天然的优势,非常适合于需要快速绘图更新、视频或实时交互性的操作场合,在数学、科学和工程领域都有着广泛的应用。K线图介绍对于股票交易者来讲,K线图是弄清股票一段时间走势的一种最基本的图形工具,K线分为阳线和阴线,阳线和阴线
系统 2019-09-27 17:45:49 2452
科大讯飞属于第三方服务,但是支持的语言里面没有python,所以我们在这种情况下还想使用它的功能的话,可以通过调用C语言的包,来间接的使用。代码贴上来:deftext_to_voice(text):"""科大讯飞离线语音合成:paramtext:转换文本开发API文档:http://mscdoc.xfyun.cn/windows/api/iFlytekMSCReferenceManual/files.htmlAPI调用流程:https://doc.xfyu
系统 2019-09-27 17:57:25 2451