搜索到与相关的文章
编程技术

机器学习-KMeans聚类 K值以及初始类簇中心点的

本文主要基于AnandRajaraman和JeffreyDavidUllman合著,王斌翻译的《大数据-互联网大规模数据挖掘与分布式处理》一书。KMeans算法是最常用的聚类算法,主要思想是:在给定K值和K个初始类簇中心点的情况下,把每个点(亦即数据记录)分到离其最近的类簇中心点所代表的类簇中,所有点分配完毕之后,根据一个类簇内的所有点重新计算该类簇的中心点(取平均值),然后再迭代的进行分配点和更新类簇中心点的步骤,直至类簇中心点的变化很小,或者达到指定的

系统 2019-08-12 01:32:45 2031

Python

利用anaconda作为python的依赖库管理方法

python自带的pip管理依赖库太麻烦,pip很多库不存在,或者一些库并不支持window系统。而且每次用pip下载库经常不成功,结果还是要手动下载跟自己python对应的whl包安装库。遇到了很多坑之后,发现神奇anaconda,便查阅资料,整理好记录到这里1、下载anacondaanaconda可以提供了python的很多库管理,支持多个系统下载地址:https://www.anaconda.com/download/这里我下载了python3.6,

系统 2019-09-27 17:57:26 2030

Python

python的re模块使用方法详解

一、正则表达式的特殊字符介绍正则表达式^匹配行首$匹配行尾.任意单个字符[]匹配包含在中括号中的任意字符[^]匹配包含在中括号中的字符之外的字符[-]匹配指定范围的任意单个字符?匹配之前项的1次或者0次+匹配之前项的1次或者多次*匹配之前项的0次或者多次{n}匹配之前项的n次{m,n}匹配之前项最大n次,最小m次{n,}配置之前项至少n次二、re模块的方法介绍1、匹配类方法a、findall方法#findall方法,该方法在字符串中查找模式匹配,将所有的匹

系统 2019-09-27 17:56:15 2030

Python

Python爬虫利用cookie实现模拟登陆实例详解

Cookie,指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据(通常经过加密)。举个例子,某些网站是需要登录后才能得到你想要的信息的,不登陆只能是游客模式,那么我们可以利用Urllib2库保存我们以前登录过的Cookie,之后载入cookie获取我们想要的页面,然后再进行抓取。理解cookie主要是为我们快捷模拟登录抓取目标网页做出准备。我之前的帖子中使用过urlopen()这个函数来打开网页进行抓取,这仅仅只是一个简单的Py

系统 2019-09-27 17:56:06 2030

Python

详解Python列表赋值复制深拷贝及5种浅拷贝

概述在列表复制这个问题,看似简单的复制却有着许多的学问,尤其是对新手来说,理所当然的事情却并不如意,比如列表的赋值、复制、浅拷贝、深拷贝等绕口的名词到底有什么区别和作用呢?列表赋值#定义一个新列表l1=[1,2,3,4,5]#对l2赋值l2=l1print(l1)l2[0]=100print(l1)示例结果:[1,2,3,4,5][100,2,3,4,5]可以看到,更改赋值后的L2后L1同样也会被更改,看似简单的“复制”,在Python中,列表属于可变对象

系统 2019-09-27 17:55:41 2030

Python

简单了解python协程的相关知识

什么是协程协程是python种一种实现多任务的方式,他是一种比线程更加小的单元,占用更小的执行单元(资源),为啥说他是一个执行单元,因为他自带CPU上下文,这样在合适gr的时机,可以把一个协程切换到另一个协程,只要在这个过程中保存和恢复cpu上下文那么程序还是可以运行的通俗的理解:一个线程中的某个函数,可以在任何地方保存当前函数的一些临时变量,然后切换到另一个函数中运行,并且切换的次数以及社么时候再切换回来是可控的协程和线程的差异在实现多任务时,线程会自己

系统 2019-09-27 17:55:38 2030

Python

python——uBuntu中pip执行import main失败问题

一、ubuntu中使用pip3安装gevent时,提示:cannotimportname'main'问题;二、问题解决:解决pip3使用异常,在python3中可以使用__main__,修改如下:报错中已经提示pip文件路径:/usr/bin/pip3,cd进去,进行修改(需要管理员身份保存修改后文件,sudo执行)源文件出错内容:frompipimportmainif__name__=='__main__':sys.exit(main())修改为:fro

系统 2019-09-27 17:55:31 2030

Python

python面向对象基础(三)

本节开始,我们将讨论面向对象编程的三大特征:封装、继承和多态。下面,我们将由简至难,依次讨论封装、继承、多态。一.封装enclosure封装:指隐藏类的实现细节,让使用者不用关心这些细节;目的:让使用者通过尽可能少的方法(或属性)操作对象;如何封装:通过私有属性和方法;私有属性和方法:以双下划线'__'开头,不以双下划线结尾的标识符为私有成员;私有成员只能用此类的方法进行访问和修改扩展:了解java的读者可能知道,java中使用了private、defau

系统 2019-09-27 17:54:10 2030

Python

python多线程操作实例

一、python多线程因为CPython的实现使用了GlobalInterpereterLock(GIL),使得python中同一时刻只有一个线程在执行,从而简化了python解释器的实现,且python对象模型天然地线程安全。如果你想你的应用程序在多核的机器上使用更好的资源,建议使用multiprocessing或concurrent.futures.processpoolexecutor。但是如果你的程序是IO密集型,则使用线程仍然是很好的选择。二、p

系统 2019-09-27 17:54:03 2030

Python

用 Python 写一个安卓 APP

点击上方“码农突围”,马上关注,每天早上8:50准时推送真爱,请置顶或星标作者:youerninghttp://youerning.blog.51cto.com/10513771/1733534前言用Python写安卓APP肯定不是最好的选择,目前用Java和kotlin写的居多,但是肯定也是一个很偷懒的选择,而且实在不想学习Java,再者,就编程而言已经会的就Python与Golang(注:Python,Golang水平都一般),那么久Google了一下

系统 2019-09-27 17:53:59 2030