一.特征选择-单变量特征选择1.SelectKBest可以依据相关性对特征进行选择,保留k个评分最高的特征。方差分析分类问题使用f_classif,回归问题使用f_regression。f_classif:分类任务跟目标的分类,将样本划分成n个子集,S1,S2,..,Sn,我们希望每个子集的均值μ1,μ2,...,μn不相等。我们假设H0:μ1=μ2=...=μn,当然我们希望拒绝H0,所以我们希望构造出来f最大越好。所以我们可以通过第i个特征xi对分类进
系统 2019-09-27 17:48:11 2440
由于nltk等都没有实现句子级别的tokenize,或者文本分句。这里使用python正则,快速实现一个,可以把文本分成若干个小句子。代码如下,如果你想要实现自己个性化的分句,例如只考虑“。!”等的分句,可以调整正则项,“|”代表或的意思。defsent_tokenize(x):sents_temp=re.split('(:|:|,|,|。|!|\!|\.|?|\?)',x)sents=[]foriinrange(len(sents_temp)//2):s
系统 2019-09-27 17:47:38 2440
系统环境CentOS7.3阿里云服务器1.ll/usr/bin/python*2.此时python的默认版本还是2.7.53.mvpythonpython.bak备份源文件后期可以恢复2.7.5版本4.下载自己需要的python版本https://www.python.org/ftp/python/以3.5为例子5.下载好了利用FTP工具上传到/root上传不再演示6.mkdir/usr/local/python3创建python3的文件存放位置依照个人习
系统 2019-09-27 17:57:41 2439
MongoDB爬虫实践:爬取虎扑论坛网站地址为:https://bbs.hupu.com/bxj1.网站分析首先,定位网页上帖子名称、帖子链接、作者、作者链接、创建时间、回复数目、浏览数目、最后回复用户、最后回复时间等信息的位置,之后,我们使用BeautifulSoup在网页中定位这些。数据所在的位置数据位置某帖子所有数据‘li’帖子名称divclass="titlelinkbox">a帖子链接divclass="titlelinkbox">a['href
系统 2019-09-27 17:55:14 2439
目录Ubuntu18.04安装cuda10.1、Anaconda(Python3.7)、TensorFlow2.0.0alpha0安装操作系统下载Ubuntu18.04.2LTS采用U盘启动镜像盘烧写工具Rufus修改Ubuntu18.04默认桌面(!!!)安装cuda添加cudaPATH环境变量安装Anaconda安装Pycharm安装Pytorch安装TensorFlow测试pytorch是否已经成功利用gpu加速测试TensorFlow是否已经成功利
系统 2019-09-27 17:53:40 2439
前言图片的本质就是大量像素在二维平面上的组合,每个像素点用数字化方式记录颜色。可以直观的想象,一张图片就是一个巨大的电子栅格,每个格子内有一盏灯泡,这个灯泡可以变换256的三次方种颜色,就像下面这张卡通像素图一样,越清晰的图片像素越密集。这一次来看看OpenCV提供的两种图像质量对比方式(PSNR&SSIM)及其扩展,这篇文章会涉及到一点数学公式,顺便介绍一个我用过的生成公式的最佳在线编辑工具,秒杀所有收费工具。链接在这里,请收好:https://www.
系统 2019-09-27 17:51:59 2439
我是小白就不用多说了,学习python做了个练习题,结果运行了一遍,发现输入金额后得到的有很多位小数,虽然不知道为什么,但是看得很不舒服,就想到应该把让小数点后只保留2位数找到了方法:将{0}改为{:.2f}#一家商场在降价促销。如果购买金额50-100元(包含50元和100元)之间,#会给10%的折扣,如果购买金额大于100元会给20%折扣。编写一程序,#询问购买价格,再显示出折扣(%10或20%)和最终价格sum_money=float(input('
系统 2019-09-27 17:50:48 2439
ipython介绍IPython是一个python的交互式shell,比默认的pythonshell好用得多,支持变量自动补全,自动缩进,支持bashshell命令,内置了许多很有用的功能和函数。IPython是基于BSD开源的。IPython为交互式计算提供了一个丰富的架构,包含:强大的交互式shellJupyter内核交互式的数据可视化工具灵活、可嵌入的解释器易于使用,高性能的并行计算工具IPython的开发者吸收了标准解释器的基本概念,在此基础上进行
系统 2019-09-27 17:48:58 2439
基于python的socket实现单机五子棋到双人对战,供大家参考,具体内容如下本次实验使用python语言。通过socket进行不同机器见的通信,具体可以分为以下四步:1.创建ServerSocket和Socket;2.打开链接到Socket的输入/输出流;3.按照协议对Socket进行读/写操作;4.关闭输入输出流、关闭Socket。由于是双人对战,服务器必须应对多人及以上的客户端的连接,因此本实验还引入了python的threading多线程模块,通
系统 2019-09-27 17:48:47 2439
1.安装python1)noacceptableCcompilerfoundin$PATHwheninstallingpython解决方法:系统基于redhat,则:yumgroupinstall"Developmenttools"系统基于Debian:apt-getinstallbuild-essential2)ubuntuE:Package'libpng12-dev'或者E:Package'libjpeg8-dev'hasnoinstallationc
系统 2019-09-27 17:48:10 2439
Python中strisnotcallable问题详解及解决办法问题提出:在Python的代码,在运行过程中,碰到了一个错误信息:python代码:defcheck_province_code(province,country):num=len(province)whilenum<3:province=''.join([str(0),province])num=num+1returncountry+province运行的错误信息:check_provinc
系统 2019-09-27 17:56:40 2438
很多文件为了安全都会存成PDF格式,比如有的论文、技术文档、书籍等等,这给程序读取这些文档内容带来了很多麻烦。Python目前解析PDF的扩展包有很多,本文将对比介绍PyPDF2、pdfplumber、pdfminer3k以及Camelot,告诉你哪个是好用的PDF解析工具。码字不易,喜欢请点赞!!!本文使用的案例PDF文档下载链接:链接:https://pan.baidu.com/s/1zH7vY47AqBYKM0XbdABbUA提取码:xhem另外,获
系统 2019-09-27 17:56:27 2438
计算字符串中所有数字的和,字符串中有数字和字母组合而成如果出现连续数字,按照一个数操作具体解释在代码行里:defsum_str(str1):len1=len(str1)#首先将字符串str1的长度赋值给len1sum=n=0#建立一个值为0的空变量sun#建立一个值为0的空变量nforiinrange(len1):#用i来遍历字符串的长度if49<=ord(str1[i])<=57:#判断字符ascii码是否在数字ascii值范围内n=n*10#n*=10
系统 2019-09-27 17:49:34 2438
方法fabs()返回x的绝对值。语法以下是fabs()方法的语法:importmathmath.fabs(x)注意:此函数是无法直接访问的,所以我们需要导入math模块,然后需要用math的静态对象来调用这个函数。参数x--这是一个数值。返回值此方法返回x的绝对值。例子下面的例子显示fabs()方法的使用。#!/usr/bin/pythonimportmath#Thiswillimportmathmoduleprint"math.fabs(-45.17):
系统 2019-09-27 17:47:42 2438
字典中的键使用时必须满足一下两个条件:1、每个键只能对应一个项,也就是说,一键对应多个值时不允许的(列表、元组和其他字典的容器对象除外)。当有键发生冲突时(即字典键重复赋值),取最后的赋值。复制代码代码如下:>>>myuniversity_dict={'name':'yuanyuan','age':18,'age':19,'age':20,'schoolname':Chengdu,'schoolname':Xinxiang}Traceback(mostre
系统 2019-09-27 17:37:47 2438