搜索到与相关的文章
编程技术

【文本分类】文本表示 --- VSM

要使得计算机能高效的处理真实文本,就必须找到一种理想的形式化表示方法,这种表示一方面能真实的反映文档内容(主题、领域或结构等),另一方面也要有对不同文档的区分能力。目前文本表示通常采用向量空间模型(vectorspacemodel,VSM)。VSM是20世纪60年代末期由G.Salton等人提出的,是当前自然语言处理中常用的主流模型。下面首先给出VSM设计的基本概念:(1)文档(document):通常是文章中具有一定规模的字符串。文档通常我们也叫文本。(

系统 2019-08-29 21:59:30 2152

各行各业

github ip映射数据

207.97.227.239github.com207.97.227.252nodeload.github.com207.97.227.243raw.github.com204.232.175.78documentcloud.github.com204.232.175.94gist.github.com204.232.175.78pages.github.com添加到hosts中即可。经过博主验证这个方法已经被github官方封锁,所以建议各位把DNS服务

系统 2019-08-12 09:27:00 2152

各行各业

帮同事写了几行代码,在 安装/卸载 程序里 注册

写了个小控制台程序,这个程序用来注册/卸载OCX控件,用在InnoSetup做的安装卸载程序里。#include"stdafx.h"#include#includeusingstd::cout;usingstd::endl;usingstd::cerr;int_tmain(intargc,_TCHAR*argv[]){__try{STARTUPINFOsi1={sizeof(si1)};PROCESS_INFORM

系统 2019-08-12 09:26:56 2152

编程技术

大话设计模式---备忘录模式

备忘录模式:在不破坏封装性的前提下,捕获一个对象的内部状态,并在该对象之外保存这个状态。这样以后就可将该对象恢复到原先保存的状态。Memento模式比较适用于功能比较复杂的,但需要维护或记录属性历史的类,或者需要保存的属性只是众多属性中的一小部分时,Originator可以根据保存的Memento信息还原到前一状态。大话设计模式---备忘录模式

系统 2019-08-12 01:33:16 2152

Python

python里运用私有属性和方法总结

如何在PYTHON里运用私有属性和方法classFile:def__init__(self,name):self.name=nameself.code="ABCDEF"file_A=File("file_A")#假设我们有一个类,叫做文件类,设置一个对象file_A。file_A.code#如果直接调用属性,是可以看到属性里面有什么,但是如果这是个机密的密码不能公布,是不能这么处理的。classFile:def__init__(self,name):sel

系统 2019-09-27 17:57:30 2151

Python

python2爬取百度贴吧指定关键字和图片代码实例

目的:在百度贴吧输入关键字和要查找的起始结束页,获取帖子里面楼主所发的图片思路:获取分页里面的帖子链接列表获取帖子里面楼主所发的图片链接列表保存图片到本地注意事项:问题:在谷歌浏览器使用xpathhelper插件时有匹配结果,但在程序里面使用python内带的xpath匹配却为空的原因。原因:不同服务器会对不同的浏览器返回不同的数据,导致在谷歌浏览器看到的和服务器返回的有区别解决方法:使用IE浏览器的User-agenet,而且越老的版本,报错几率相对越小

系统 2019-09-27 17:57:03 2151

Python

python爬虫小案例_从豆瓣爬取多页的图书信息保存到数据库(MongoDB)

一、在豆瓣网爬取以下图书的信息:二、参考代码:1、连接MongoDB数据库,并且创建数据库和表importpymongomyclient=pymongo.MongoClient("mongodb://127.0.0.1:27017/")db=myclient['webCrawler']#创建数据库webCrawlerdatatable=db['Book_info']#创建Book_info表2、爬取数据并且存储到数据库importreimportpanda

系统 2019-09-27 17:56:44 2151

Python

Python中的数值、字符串、元组及列表实例介绍

一、数据类型:-数值-字符串-列表-元组-字典1.数值类型:(1)整型In[6]:a=123In[7]:type(a)Out[7]:intIn[8]:(2)长整型In[8]:a=199999999999999999999999999999In[9]:aOut[10]:199999999999999999999999999999LIn[11]:type(a)Out[12]:longIn[13]:(3)浮点型0.0,12.0-18.83e+7等科学计数法是浮点

系统 2019-09-27 17:56:05 2151

Python

Python中的类与类型示例详解

1.经典类与新式类在了解Python的类与类型前,需要对Python的经典类(classicclasses)与新式类(new-styleclasses)有个简单的概念。在Python2.x及以前的版本中,由任意内置类型派生出的类(只要一个内置类型位于类树的某个位置),都属于“新式类”,都会获得所有“新式类”的特性;反之,即不由任意内置类型派生出的类,则称之为“经典类”。“新式类”和“经典类”的区分在Python3.x之后就已经不存在,在Python3.x之

系统 2019-09-27 17:55:45 2151