搜索到与相关的文章
编程技术

【文本分类】文本表示 --- VSM

要使得计算机能高效的处理真实文本,就必须找到一种理想的形式化表示方法,这种表示一方面能真实的反映文档内容(主题、领域或结构等),另一方面也要有对不同文档的区分能力。目前文本表示通常采用向量空间模型(vectorspacemodel,VSM)。VSM是20世纪60年代末期由G.Salton等人提出的,是当前自然语言处理中常用的主流模型。下面首先给出VSM设计的基本概念:(1)文档(document):通常是文章中具有一定规模的字符串。文档通常我们也叫文本。(

系统 2019-08-29 21:59:30 2007

编程技术

认识项目管理

目前,随着IT项目规模和复杂性不断提高,尤其是一个软件项目,它成功的关键点已从原来的技术上转移到管理上。目前,政府、企业、大公司包括一些小公司和个人也逐渐意识到项目管理的重要性,但是现今国外内项目成功率都不高。据斯坦迪什咨询集团的调查数据,美国1995年所有IT技术项目平均成功率只有16.2%,到1998年,这个数据也仅仅达到了26%,2006年,成功率为36%,而国内信息技术项目的成功率则还要低很多。不成功的原因很多,个人认为主要问题是,管理人员的“管理

系统 2019-08-12 09:30:27 2007

编程技术

最初的ajax案例

----------------------原始的ajax:functionguo(){varxhrif(XMLHttpRequest){xhr=newXMLHttpRequest();}else{xhr=ActiveXObject("XMLHttpRequest");}//ie5和ie6是activeobject;//请求方式,地址,是否异步;xhr.open("get","../Handler/test.ashx",true);//发送请求xhr.se

系统 2019-08-12 01:33:11 2007

Python

使用Python写CUDA程序的方法

使用Python写CUDA程序有两种方式:*Numba*PyCUDAnumbapro现在已经不推荐使用了,功能被拆分并分别被集成到accelerate和Numba了。例子numbaNumba通过及时编译机制(JIT)优化Python代码,Numba可以针对本机的硬件环境进行优化,同时支持CPU和GPU的优化,并且可以和Numpy集成,使Python代码可以在GPU上运行,只需在函数上方加上相关的指令标记,如下所示:importnumpyasnpfromti

系统 2019-09-27 17:56:19 2006

Python

python获取指定时间差的时间实例详解

python获取指定时间差的时间实例详解在分析数据的时间经常需要截取一定范围时间的数据,比如三天之内,两小时前等等时间要求的数据,因此将该部分经常需要用到的功能模块化,方便以后以后用到的时候复用。在此,也分享给大家。importtimeimportsysreload(sys)defget_day_of_day(UTC=False,days=0,hours=0,miutes=0,seconds=0):'''''''ifdays>=0,dateislarger

系统 2019-09-27 17:56:08 2006

Python

Python中几种导入模块的方式总结

模块内部封装了很多实用的功能,有时在模块外部调用就需要将其导入。常见的方式有如下几种:1.import>>>importsys>>>sys.path['','C:\\Python34\\Lib\\idlelib','C:\\Windows\\system32\\python34.zip','C:\\Python34\\DLLs','C:\\Python34\\lib','C:\\Python34','C:\\Python34\\lib\\site-pack

系统 2019-09-27 17:55:57 2006

Python

python3中类的继承以及self和super的区别详解

python中类的继承:子类继承父类,及子类拥有了父类的属性和方法。python中类的初始化都是__init__()。所以父类和子类的初始化方式都是__init__(),但是如果子类初始化时没有这个函数,那么它便调用父类的__init__();如果实现了这个函数,就会覆盖父类的初始化函数。如果继承父类的__init__(),就需要在子类中显示调用这个函数。实现如下:classAnimal(object):def__init__(self):self.nam

系统 2019-09-27 17:55:47 2006

Python

Python 上下文管理器(contextor)

最直观的上下文,莫过于小学的语文课,经常会问联系上下文,推测...,回答...,表明作者...。文章里的上下文比较好懂,无非就是前与后。在了解了计算机的执行状态,程式的运行,才稍微对计算机的上下文(context)有了一定的认识,多半还是只可意会,不可言传。本文所讨论的上下文,简而言之,就是程式所执行的环境状态,或者说程式运行的情景。提及上下文,就不可避免的涉及Python中关于上下文的魔法,即上下文管理器(contextor)。资源的创建和释放场景上下文

系统 2019-09-27 17:55:33 2006

Python

跟老齐学Python之Import 模块

认识模块对于模块,在前面的一些举例中,已经涉及到了,比如曾经有过:importrandom(获取随机数模块)。为了能够对模块有一个清晰的了解,首先要看看什么模块,这里选取官方文档中对它的定义:复制代码代码如下:AmoduleisafilecontainingPythondefinitionsandstatements.Thefilenameisthemodulenamewiththesuffix.pyappended.Withinamodule,themo

系统 2019-09-27 17:55:19 2006

Python

Python3之数据指纹MD5校验与对比

MD5消息摘要算法(英语:MD5Message-DigestAlgorithm),一种被广泛使用的密码散列函数,可以产生出一个128位(16字节)的散列值(hashvalue),用于确保信息传输完整一致。MD5由美国密码学家罗纳德·李维斯特(RonaldLinnRivest)设计,于1992年公开,用以取代MD4算法。概述MD5校验码通过散列函数计算而成,可以生成任何数据的数据“指纹”,即我们可以利用MD5将消息或者数据压缩成摘要,是的数据量变小,便于比较

系统 2019-09-27 17:54:19 2006