一.概述首先需要先介绍一下无监督学习,所谓无监督学习,就是训练样本中的标记信息是位置的,目标是通过对无标记训练样本的学习来揭示数据的内在性质以及规律。通俗得说,就是根据数据的一些内在性质,找出其内在的规律。而这一类算法,应用最为广泛的就是“聚类”。聚类算法可以对数据进行数据归约,即在尽可能保证数据完整的前提下,减少数据的量级,以便后续处理。也可以对聚类数据结果直接应用或分析。而Kmeans算法可以说是聚类算法里面较为基础的一种算法。二.从样例开始我们现在在
系统 2019-09-27 17:50:00 2203
python3中的字符串是一种常见的数据类型。字符串有多种表现形式:单引号、双引号和三引号,且这些字符串的表现形式(单、双、三)都必须是成对出现的。单、双引号是英文的:‘'和"",三引号则是三个单引号或者三个双引号都可以:""""""或者'''''',在python中打出来时没有顺序之分(其实也看不出来顺序...),在一对引号的中间打上东西就是字符串,例如:#单引号#'123''小明''xyz'#双引号#"123""小明""xyz"关于单引号:单引号比较特
系统 2019-09-27 17:49:33 2203
一、在豆瓣电影网爬取以下剧照保存到本地:本次案例只爬取前5页的剧照,先获取前五页的链接:foriinrange(5):url='https://movie.douban.com/subject/26794435/photos?type=S&start='+str(i*30)+'&sortby=like&size=a&subtype=a'print(url)由下图可知这些剧照是在ul标签下二、爬取和保存到本地的参考代码如下:#导入相应的模块importosi
系统 2019-09-27 17:49:06 2203
下面一段代码给大家介绍python处理微信对账单数据,具体代码如下所示:#下载对账单并存储到数据库@app.route("/bill/",methods=["GET","POST"])defdownload_bill(date):pay=MyWeiXinPay()#自己的支付类bill=pay.download_mybill(date)#下载原始对账单,下载下来为字符串billArray=bill.split("\r\n")#分割账单,一行为一组数据,分割
系统 2019-09-27 17:48:58 2203
题目描述给定n个字符串,请对n个字符串按照字典序排列。输入描述:输入第一行为一个正整数n(1≤n≤1000),下面n行为n个字符串(字符串长度≤100),字符串中只含有大小写字母。输出描述:数据输出n行,输出结果为按照字典序排列的字符串。示例1输入9captocatcardtwotooupboatboot输出boatbootcapcardcattotootwouppython3代码实现为:n=int(input())word=[]foriinrange(n
系统 2019-09-27 17:48:16 2203
在家里windows环境下搞了一次见pythonMySQLdb在windows环境下的快速安装、问题解决方式//www.jb51.net/article/65746.htm在公司开发需要,再搞一次,linux下的。发现用编译的方式安装真的很蛋疼,不过也算见见世面,各种问题......奋斗这里也有两种方式:A.快速安装B.自己编译1.最快速最简单方法(赶时间的话)复制代码代码如下:sudoyuminstallMySQL-python可能遇到问题:复制代码代码
系统 2019-09-27 17:48:02 2203
Scrapy官方介绍是Anopensourceandcollaborativeframeworkforextractingthedatayouneedfromwebsites.Inafast,simple,yetextensibleway.意思就是一个开源和协作框架,用于以快速,简单,可扩展的方式从网站中提取所需的数据。环境准备本文项目使用环境及工具如下python3scrapymongodbpython3scrapy的安装就不再叙述mongodb是用来存
系统 2019-09-27 17:46:17 2203
1、需求我们的代码已经变得无法阅读,到处都是硬编码的切片索引,我们想优化他们。2、解决方案代码中如果有很多硬编码的索引值,将导致可读性和维护性都不佳。内置的slice()函数会创建一个切片对象,可以用在任何运行进行切片操作的地方。items=[0,1,2,3,4,5,6]a=slice(2,4)print(items[2:4])print(items[a])items[a]=[10,11,12,13]print(items)delitems[a]print
系统 2019-09-27 17:38:37 2203
本文总结的是我们大家在python中常见的数据预处理方法,以下通过sklearn的preprocessing模块来介绍;1.标准化(StandardizationorMeanRemovalandVarianceScaling)变换后各维特征有0均值,单位方差。也叫z-score规范化(零均值规范化)。计算方式是将特征值减去均值,除以标准差。sklearn.preprocessing.scale(X)一般会把train和test集放在一起做标准化,或者在tr
系统 2019-09-27 17:38:06 2203
开源项目是提高自身能力和做你喜欢的事的好方法,有其他项目的实际经验也能让你更符合求职要求,给你带来更多的机会。问题是大家都不知道从哪里开始。以下6个简单的提示告诉你如何开始F/OSS(FreeandOpenSourceSoftware).1.参与那些你使用过的开源软件背后的项目这很显然,请不要去寻找那些你既没用过也不了解的软件的项目。根据你用过的开源软件,来列一个你可能会参与的开源项目清单。不要遗漏了参与库文件或模块开发的可能——参与专门为开发者服务服务的
系统 2019-08-29 23:20:19 2203