一、关联规则关联规则,顾名思义,就是寻找事物之间的关联关系。比如《啤酒与尿布》中,在某个特定时间段,会出现啤酒与尿布同时出现在购物篮中的现象,且出现频率非常高。调研发现这是一群爱喝啤酒的奶爸群体。如果可以通过类似的方式挖掘更多特定的群体需求,就可以进行交叉销售或捆绑销售来提升销售额和利润。Apriori算法就是经典的寻找物品的关联算法。二、Apriori算法原理1、基础概念项集:包含0个或者多个项的集合称为项集频繁项集:那些经常一起出现的物品集合2、关联规
系统 2019-09-27 17:55:14 2312
目录工作原理python实现算法实战对mnist数据集进行聚类小结附录工作原理聚类是一种无监督的学习,它将相似的对象归到同一个簇中。类似于全自动分类(自动的意思是连类别都是自动构建的)。K-均值算法可以发现k个不同的簇,且每个簇的中心采用簇中所含值的均值计算而成。它的工作流程的伪代码表示如下:创建k个点作为起始质心当任意一个点的簇分配结果发生改变时对数据集中的每个数据点对每个质心计算质心与数据点之间的距离将数据点分配到距其最近的簇对每一个簇,计算簇中所有点
系统 2019-09-27 17:52:50 2312
要安装运行Python的容器,那先到https://hub.docker.com/去查找一下,看看有哪些可用的镜像。恩,最高的版本已经是3.8.0b4了,不过考虑下还是安装3.7.4稳定版把。用来安装的虚拟机是Ubuntu18.04服务器版,安装虚拟机就跳过不写了,太简单。为了方便,使用root用户操作。在Ubuntu上安装Docker使用官方脚本,在终端输入curl-fsSLget.docker.com-oget-docker.sh瞬间下载安装脚本:-r
系统 2019-09-27 17:51:07 2312
准备软件版本Django2.1.3Python3.7.1默认使用的是sqlite3DATABASES={'default':{'ENGINE':'django.db.backends.sqlite3','NAME':os.path.join(BASE_DIR,'db.sqlite3'),}}切换为MySql:#settings.pyDATABASES={'default':{'ENGINE':'django.db.backends.mysql','NAME
系统 2019-09-27 17:50:54 2312
今天我们会讲到一个[装饰器]注记:链接“装饰器”指Python3教程中的装饰器教程。可以在这里快速了解什么是装饰器。@functools.lru_cache――进行函数执行结果备忘,显著提升递归函数执行时间。示例:寻找宝藏。在一个嵌套元组tuple或列表list中寻找元素'GoldCoin'importtimefromfunctoolsimportlru_cachedeffind_treasure(box):foriteminbox:ifisinstanc
系统 2019-09-27 17:50:04 2312
如题因为要求的是连续子序列和的最大值,所以分类应为c[i]要不要i之前的序列对于第i个元素,1)要i之前的序列,则table[i1]+c[i]2)不要i之前的序列,则c[i]取两者里边的最大值给了table[i]numpy.argmax(list):返回列表中最大元素的索引详解argmaxdefbottom_up_seque(c):lent=len(c)table=[None]*(lent+1)table[0]=0table[1]=c[0]foriinra
系统 2019-09-27 17:49:17 2312
BeautifulSoup库解析器解析器使用方法条件bs4的HTML解析器BeautifulSoup(mk,'html.parser')安装bs4库lxml的HTML解析器BeautifulSoup(mk,'xml')pipinstalllxmllxml的XML解析器BeautifulSoup(mk,'xml')pipinstalllxmlhtml5lib的解析器BeautifulSoup(mk,'htm5lib')pipinstallhtm151ibBe
系统 2019-09-27 17:46:52 2312
阅读更多最近尝试使用request来发送上传文件的post请求,网上找了很多直接post文件的例子,借鉴发现这个方法行不通,于是尝试了另外一种方式:通过第三方包requests_toolbelt讲文件转为数据流来发送请求,尝试成功。第一类,单个文件,包含在消息体#-*-coding:utf-8-*-importrequests#引入requests_toolbelt包,直接使用数据流来发送上传文件的post请求fromrequests_toolbelt.m
系统 2019-09-27 17:45:24 2312
#python版一行内容分行输出a="aA1一bB2二cC3三dD4四eE5五fF6六gG7七hH8八iI9九""""分行输出为:abcdefghiABCDEFGHI123456789一二三四五六七八九"""print("方法一:===============")forrinrange(0,4):t=''forsinrange(0+r,len(a),4):t=t+a[s]print(t)print("方法二:===============")#=_=这个方
系统 2019-09-27 17:38:38 2312
摘要在用Python处理数据时,可能有时候会需要将时间转换成时间戳,或者说将时间戳转换成时间,这里分享一下时间戳与时间的相互转换的方法。在Python里面处理时间相关问题,基本上用的包就是time和datetime两个,这里也是用这两个包实现时间戳和时间的相互转换。码字不易,喜欢请点赞!!!导入需要的包时间戳转换成时间在时间戳转换成时间的时候要注意,你的时间戳是秒级别的还是毫秒级别的,如果是毫秒级别的你需要除1000转换成秒级别的,否则会报错。时间转换成时
系统 2019-09-27 17:56:11 2311
概述递归函数即直接或间接调用自身的函数,且递归过程中必须有一个明确的递归结束条件,称为递归出口。递归极其强大一点就是能够遍历任意的,不可预知的程序的结构,比如遍历复杂的嵌套列表。递归求和我们可以利用递归函数实现一个Python内置函数sum()的递归版。#递归defd_sum(L):ifnotL:return0else:returnL[0]+d_sum(L[1:])sum_l=d_sum(range(10))print(sum_l)示例结果45该递归函数怎
系统 2019-09-27 17:55:52 2311
栈(stack)又名堆栈,它是一种运算受限的线性表。其限制是仅允许在表的一端进行插入和删除运算。这一端被称为栈顶,相对地,把另一端称为栈底。向一个栈插入新元素又称作进栈、入栈或压栈,它是把新元素放到栈顶元素的上面,使之成为新的栈顶元素;从一个栈删除元素又称作出栈或退栈,它是把栈顶元素删除掉,使其相邻的元素成为新的栈顶元素。栈可以用顺序表实现,也可以用链表实现,这里为了方便就用顺序表实现。#-*-coding:utf-8-*-classStack(objec
系统 2019-09-27 17:55:26 2311
近日,微软在Github上开源了一个Python静态类型检查工具:pyright,引起了社区内的多方关注。微软在开源项目上的参与力度是越来越大了,不说收购Github这种大的战略野心,只说它家开源的VSCode编辑器,在猿界已割粉无数,连我Python圈的红人KennethReitz(多个开源项目的作者,包括requests、requests-html、responder等)都对它赞不绝口。如今开源的Pyright,口碑还不错,那我们就来看看它有啥本事,顺
系统 2019-09-27 17:50:02 2311
urllib库是python内置的http请求库,包含四个模块:函数说明urllib.request请求模块urllib.error异常处理模块urllib.parseURL解析模块urllib.robotparserrobots.txt模块robots.txt是Robots协议(网络爬虫排除协议),是互联网界通行的道德模范,基于以下原则:搜索技术应服务于人类,同时尊重信息提供者的意愿,并维护其隐私权网站有义务保护其使用者的个人信息和隐私不被侵犯爬取白度网
系统 2019-09-27 17:48:19 2311
如下所示:
系统 2019-09-27 17:47:14 2311