搜索到与相关的文章
编程技术

【文本分类】文本表示 --- VSM

要使得计算机能高效的处理真实文本,就必须找到一种理想的形式化表示方法,这种表示一方面能真实的反映文档内容(主题、领域或结构等),另一方面也要有对不同文档的区分能力。目前文本表示通常采用向量空间模型(vectorspacemodel,VSM)。VSM是20世纪60年代末期由G.Salton等人提出的,是当前自然语言处理中常用的主流模型。下面首先给出VSM设计的基本概念:(1)文档(document):通常是文章中具有一定规模的字符串。文档通常我们也叫文本。(

系统 2019-08-29 21:59:30 2049

Python

python object类

object类object是python的默认类,有很多的方法,python种默认的list,str,dict等等都是继承了object类的方法继承了object的类属于新式类,没有继承属于经典类在python3种默认都是新式类,也即是所有的自定义类,基类都会继承object类描述在python3.x的所有类都是object的子类所以对于一些内置的方法会写在object类中如果子类不定义,在调用的时候最终会调用object类中的方法就不会让程序出现不必要的

系统 2019-09-27 17:56:43 2048

Python

使用Python正则表达式操作文本数据的方法

什么是正则表达式正则表达式,是简单地字符的序列,可指定特定的搜索模式。正则表达式已存在很长一段时间,并且它本身就是计算机科学的一个领域。在Python中,使用Python的内置re模块处理正则表达式操作。在本节中,我将介绍创建正则表达式并使用它们的基础知识。您可以使用以下步骤实现正则表达式:指定模式字符串。将模式字符串编译为正则表达式对象。使用正则表达式对象在字符串中搜索模式。可选:从字符串中提取匹配的模式。编写和使用正则表达式在Python中创建正则表达

系统 2019-09-27 17:56:28 2048

Python

python自动化测试之setUp与tearDown实例

本文实例讲述了python自动化测试之setUp与tearDown的用法,分享给大家供大家参考。具体如下:实例代码如下:classRomanNumeralConverter(object):def__init__(self):self.digit_map={"M":1000,"D":500,"C":100,"L":50,"X":10,"V":5,"I":1}defconvert_to_decimal(self,roman_numeral):val=0for

系统 2019-09-27 17:56:11 2048

Python

Python 上下文管理器(contextor)

最直观的上下文,莫过于小学的语文课,经常会问联系上下文,推测...,回答...,表明作者...。文章里的上下文比较好懂,无非就是前与后。在了解了计算机的执行状态,程式的运行,才稍微对计算机的上下文(context)有了一定的认识,多半还是只可意会,不可言传。本文所讨论的上下文,简而言之,就是程式所执行的环境状态,或者说程式运行的情景。提及上下文,就不可避免的涉及Python中关于上下文的魔法,即上下文管理器(contextor)。资源的创建和释放场景上下文

系统 2019-09-27 17:55:33 2048

Python

python3中编码与解码的问题

python3中编码与解码的问题ASCII、Unicode、UTF-8ASCII我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串。每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)。也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从0000000到11111111。上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的

系统 2019-09-27 17:55:08 2048

Python

详解Python图像处理库Pillow常用使用方法

PIL(PythonImageLibrary)是python的第三方图像处理库,但是由于其强大的功能与众多的使用人数,几乎已经被认为是python官方图像处理库了。其官方主页为:PIL。PIL历史悠久,原来是只支持python2.x的版本的,后来出现了移植到python3的库pillow,pillow号称是friendlyforkforPIL,其功能和PIL差不多,但是支持python3。PIL(PythonImagingLibrary)是Python一个

系统 2019-09-27 17:54:43 2048

Python

python json操作

jsonJSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式,易于人阅读和编写。json是我们在制作爬虫时非常常见的网络对象,本文就列举python对于json的基本操作。json函数使用json函数首先要导入json库即importjson主要使用以下两个函数:json.dumps将Python对象编码成JSON字符串json.loads将已编码的JSON字符串解码为Python对象json.dumpsjson.dump

系统 2019-09-27 17:54:25 2048

Python

Python @property使用方法解析

1.作用将类方法转换为类属性,可以用.直接获取属性值或者对属性进行赋值2.实现方式使用property类来实现,也可以使用property装饰器实现,二者本质是一样的。多数情况下用装饰器实现。classStudent(object):@propertydefscore(self):returnself._score@score.setterdefscore(self,value):ifnotisinstance(value,int):raiseValueE

系统 2019-09-27 17:54:11 2048

Python

Python之路【第十一篇】:Python面向对象之封装

一引子从封装本身的意思去理解,封装就好像是拿来一个麻袋,把青菜,土豆,花菜,还有苹果一起装进麻袋,然后把麻袋封上口子。照这种逻辑看,封装=‘隐藏’,这种理解是相当片面的。在面向对象中这个麻袋就是你的类或者对象,类或者对象这俩麻袋内部装了数据属性和函数属性,那么对于类和对象来说"封"的概念从何而来,其实封的概念代表隐藏。在学完了面向对象的类和对象相关的知识后,大家都知道了如何把属性装进类或者对象中,那么如何完成封的效果呢?第一个层面的封装:类就是麻袋,这本身

系统 2019-09-27 17:52:56 2048