搜索到与相关的文章
Python

如何用Python来搭建一个简单的推荐系统

在这篇文章中,我们会介绍如何用Python来搭建一个简单的推荐系统。本文使用的数据集是MovieLens数据集,该数据集由明尼苏达大学的Grouplens研究小组整理。它包含1,10和2亿个评级。Movielens还有一个网站,我们可以注册,撰写评论并获得电影推荐。接下来我们就开始实战演练。在这篇文章中,我们会使用Movielens构建一个基于item的简易的推荐系统。在开始前,第一件事就是导入pandas和numPy。importpandasaspdim

系统 2019-09-27 17:49:14 2230

Python

python 使用Anaconda管理项目环境

Pycharm没有内置的python解释器,需要我们自己下载python解释器。在很多python项目中,会导入第三方的模块,逐个去下载导入很不方便。我们通常使用Anaconda来管理python的项目环境,Anaconda自带python解释器,且提供了大量的第三方模块,引入第三方库很方便。Anaconda的安装如果未勾选第一个添加到Path环境变量中,后面需要手动在path环境变量中添加conda.exe所在目录的路径。红框圈出的是Anaconda核心

系统 2019-09-27 17:48:58 2230

Python

python中的列表、元组、字典

列表和元组可以将列表和元组当成普通的“数组”,它能保存任意数量任意类型的Python对象。和数组一样,通过从0开始的数字索引访问元素,但是列表和元组可以存储不同类型的对象。列表和元组有几处重要的区别。列表元素用中括号([])包裹,元素的个数及元素的值可以改变。元组元素用小括号(())包裹,不可以更改(尽管他们的内容可以)。元组可以看成是只读的列表。通过切片运算([]和[:])可以得到子集,这一点与字符串的使用方法一样。>>>aList=[1,2,3,4]>

系统 2019-09-27 17:48:08 2230

Python

Python3 文章标题关键字提取的例子

思路:1.读取所有文章标题;2.用“结巴分词”的工具包进行文章标题的词语分割;3.用“sklearn”的工具包计算Tf-idf(词频-逆文档率);4.得到满足关键词权重阈值的词结巴分词详见:结巴分词Githubsklearn详见:文本特征提取――4.2.3.4Tf-idf项加权importosimportjiebaimportsysfromsklearn.feature_extraction.textimportTfidfVectorizersys.pat

系统 2019-09-27 17:48:06 2230

Python

Python入门之modf()方法的使用

modf()方法返回两个项的元组x的整数小数部分。这两个元组具有相同x符号。则返回一个浮点数的整数部分。语法以下是modf()方法的语法:importmathmath.modf(x)注意:此函数是无法直接访问的,所以我们需要导入math模块,然后需要用math的静态对象来调用这个函数。参数x--这是一个数值表达式返回值这种方法在两项的元组返回x的整数小数部分。具有相同的x符号。整数部分则返回一个浮点数。例子下面的例子显示了modf()方法的使用。#!/us

系统 2019-09-27 17:46:58 2230

编程技术

【selenium】selenium-ide安装及验证

selenium安装前提1、安装Firefox浏览器2、到官网​http://seleniumhq.org/download/下载selenium-ide-1.6.0.xpiselenium-ide安装1、下载完成后拖动文件到打开的Firefox窗口,有如下提示2、等待五秒钟后,安装按钮可用,点击安装,安装完成后会提示重启,重新启动浏览器3、重启完成后,可在菜单栏:工具-->中看到SeleniumIDE菜单项,安装完成selenium安装1、下载selen

系统 2019-08-29 23:50:49 2230

编程技术

Maven入门--概念与实例

1关键名词Project:任何您想build的事物,Maven都可以认为它们是工程。这些工程被定义为工程对象模型(POM,PojectObjectModel)。一个工程可以依赖其它的工程;一个工程也可以由多个子工程构成。POM:POM(pom.xml)是Maven的核心文件,它是指示Maven如何工作的元数据文件,类似于Ant中的build.xml文件。POM文件位于每个工程的根目录中。GroupId:groupId是一个工程的在全局中唯一的标识符,一般地

系统 2019-08-29 23:08:39 2230

编程技术

005_《Delphi6组件大全》

《Delphi6组件大全》Delphi教程系列书籍(005)《Delphi6组件大全》网友(邦)整理EMail:shuaihj@163.com下载地址:Part1Part2Part3作者:耿宏运等丛书名:软件工程师丛书出版社:电子工业出版社ISBN:7505378074上架时间:2002-8-14出版日期:2002年7月页码:1186版次:1-1内容简介本书全面详细地介绍了Delphi6可视化组件库VCL(VisualComponentLibrary)中所

系统 2019-08-29 23:01:24 2230

编程技术

J2EE初学者需要理解的问题

一、J2EE提出的背景1、企业级应用框架的需求在许多企业级应用中,例如数据库连接、邮件服务、事务处理等都是一些通用企业需求模块,这些模块如果每次再开发中都由开发人员来完成的话,将会造成开发周期长和代码可靠性差等问题。于是许多大公司开发了自己的通用模块服务。这些服务性的软件系列同陈为中间件。2、为了通用必须要提出规范,不然无法达到通用在上面的需求基础之上,许多公司都开发了自己的中间件,但其与用户的沟通都各有不同,从而导致用户无法将各个公司不同的中间件组装在一

系统 2019-08-29 22:51:51 2230

编程技术

单向加密算法

原创作者:snowolf本篇内容简要介绍BASE64、MD5、SHA、HMAC几种加密算法。BASE64编码算法不算是真正的加密算法。MD5、SHA、HMAC这三种加密算法,可谓是非可逆加密,就是不可解密的加密方法,我们称之为单向加密算法。我们通常只把他们作为加密的基础。单纯的以上三种的加密并不可靠。BASE64按照RFC2045的定义,Base64被定义为:Base64内容传送编码被设计用来把任意序列的8位字节描述为一种不易被人直接识别的形式。(TheB

系统 2019-08-29 22:42:15 2230