推荐系统中经常需要处理类似user_id,item_id,rating这样的数据,其实就是数学里面的稀疏矩阵,scipy中提供了sparse模块来解决这个问题,但scipy.sparse有很多问题不太合用:1、不能很好的同时支持data[i,...]、data[...,j]、data[i,j]快速切片;2、由于数据保存在内存中,不能很好的支持海量数据处理。要支持data[i,...]、data[...,j]的快速切片,需要i或者j的数据集中存储;同时,为了
系统 2019-09-27 17:48:09 2039
文档地址functools.partial作用:functools.partial通过包装手法,允许我们"重新定义"函数签名用一些默认参数包装一个可调用对象,返回结果是可调用对象,并且可以像原始对象一样对待冻结部分函数位置函数或关键字参数,简化函数,更少更灵活的函数参数调用复制代码代码如下:#args/keywords调用partial时参数defpartial(func,*args,**keywords):defnewfunc(*fargs,**fkey
系统 2019-09-27 17:47:58 2039
在学习python的过程中,用来练习代码,并且复习数据结构的#coding:utf-8#author:ElvisclassStack(object):def__init__(self,size=8):self.stack=[]self.size=sizeself.top=-1defis_empty(self):ifself.top==-1:returnTrueelse:returnFalsedefis_full(self):ifself.top+1==se
系统 2019-09-27 17:47:55 2039
要爬取的网站不需要登陆,没有反爬机制,操作很简单首先安装需要的程序包pipinstallrequestspipinstallbeautifulsoup4pipinstallxlwt具体的实现类GetInfo.py#信息实体类classproduct_info(object):serios=''#存放商品系列productActualPrice=''#存放商品成交价productOldPrice=''#存放商品面价detailString=''#存放商品详情
系统 2019-09-27 17:47:27 2039
抓取动态的网页内容主要有两种办法,一种是通过开发者工具找到动态内容的接口,然后分析接口的参数和返回值来爬取网站的数据。另外一种是通过模拟浏览器来抓取数据。python的Selenium库就可以通过代码来模拟浏览器抓取数据。一、概述运行Selenium需要依赖于Python的selenium库,以及浏览器对应驱动器(WebDriver)。安装selenium库pipinstallselenium项目地址:https://pypi.org/project/se
系统 2019-09-27 17:47:10 2039
rstrip()方法返回所有字符都被去除的字符串(缺省为空格字符)结束字符串的副本。语法以下是rstrip()方法的语法:str.rstrip([chars])参数chars--可以提供要去除的字符。返回值此方法返回的所有字符都被去除的字符串(缺省为空格字符)结束字符串的副本。例子下面的例子显示了rstrip()方法的使用。#!/usr/bin/pythonstr="thisisstringexample....wow!!!";printstr.rstri
系统 2019-09-27 17:47:08 2039
上面的博客把基本的HTML解析库已经说完了,这次我们来给予几个实战的项目。这次主要用Requests库+正则表达式来解析HTML。项目一:爬取猫眼电影TOP100信息代码地址:https://gitee.com/dwyui/maoyan-Requests.git项目二:美食爬取(包含多层爬取)代码地址:https://gitee.com/dwyui/meishi_Requests.git
系统 2019-09-27 17:47:06 2039
首先感谢这位博主整理的AndrewNg的deeplearning.ai的相关作业:https://blog.csdn.net/u013733326/article/details/79827273开一个我的github传送门,可以看到代码。https://github.com/VVV-LHY/deeplearning.ai/tree/master/NeuralNetworkandDeepLearning/OneHiddenLayerNN今天接着day12的
系统 2019-09-27 17:46:55 2039
函数的对象python中一切皆对象函数对象的四大功能引用deff1():print('fromf1')f1()#调用函数print(f1)print('*'*50)f=f1#将函数名f1赋值给ff()#f也可以调用函数print(f)fromf1**************************************************fromf1函数名相当于一个变量名,既能接收函数体返回的值,也能赋值。当做参数传给一个函数deff1():prin
系统 2019-09-27 17:46:53 2039
从下面字典中查找出值为数字的字符串,并显示出对应字典的键名和该值dct={'Name':['Alice','1456'],'Age':['aa','5aa','345']}#取出字典的值forvalue1indct.values():#遍历值列表forvalue2invalue1:#判断是否为数字的字符串ifvalue2.isdigit():value=value1key=[kfor(k,v)indct.items()ifv==value]print("键
系统 2019-09-27 17:46:31 2039