中文分词一直都是中文自然语言处理领域的基础研究。目前,网络上流行的很多中文分词软件都可以在付出较少的代价的同时,具备较高的正确率。而且不少中文分词软件支持Lucene扩展。但不管实现如何,目前而言的分词系统绝大多数都是基于中文词典的匹配算法。在这里我想介绍一下中文分词的一个最基础算法:最大匹配算法(MaximumMatching,以下简称MM算法)。MM算法有两种:一种正向最大匹配,一种逆向最大匹配。●算法思想正向最大匹配算法:从左到右将待分词文本中的几个
系统 2019-08-29 21:59:36 2080
本人财务狗一枚,编程基础为0。因为提升工作效率的主观愿望(备注:懒),准备开始学点python。因为平时比较忙(事多),可能更新的非常慢,估计2019年11月开始正式学习更新。给自己立个flag,主要学习内容两个:(1)提升办公效率(2)pandas库学习day1基础软件安装安装anaconda\pycharm\cmder软件介绍:Pycharm是集成开发环境(操作平台),Anaconda是集成环境管理器(库包),cmder好用的程序操作命令参考文档:Py
系统 2019-09-27 17:56:37 2079
定制pattern的string模板(template)详解string.Template的pattern是一个正则表达式,可以通过覆盖pattern属性,定义新的正则表达式.如:使用新的定界符"{{",把{{var}}作为变量语法.代码:#-*-coding:utf-8-*-'''''Createdon2014.6.5@author:Administrator@edition:python3.3.0,eclipsepydev'''importstring
系统 2019-09-27 17:56:16 2079
本文实例讲述了python测试驱动开发的方法,分享给大家供大家参考。具体方法如下:importunittestfrommainimportSampleclassSampleTest(unittest.TestCase):defsetUp(self):print"createanewSample"self._sample=Sample("b64e5843ca7db8199c405be565fa7f57")deftearDown(self):print"Des
系统 2019-09-27 17:55:39 2079
一、什么是多态<1>一种类型具有多种类型的能力<2>允许不同的对象对同一消息做出灵活的反应<3>以一种通用的方式对待个使用的对象<4>非动态语言必须通过继承和接口的方式来实现二、python中的多态<1>通过继承实现多态(子类可以作为父类来使用)<2>子类通过重载父类的方法实现多态classAnimal:defmove(self):print('animalismoving....')classDog(Animal):passdefmove(obj):ob
系统 2019-09-27 17:55:15 2079
Python中的条件语句与我之前学过的C,C++很相像,在Python里用and代替了&&(与运算符),用or代替了||(或运算符),而其他比较运算符如>,<,=,>=,<=,==,!=的用法和意义与C一致。在使用Python的if语句时,要注意冒号和缩进。最简单的if语句为if条件测试:要执行的内容如:a=5ifa>3:print("aislargerthan3")ifelse语句与此类似,如a=5ifa>3:print("aislargerthan3"
系统 2019-09-27 17:55:15 2079
Python函数编程——闭包和装饰器一、闭包关于闭包,即函数定义和函数表达式位于另一个函数的函数体内(嵌套函数)。而且,这些内部函数可以访问它们所在的外部函数中声明的所有局部变量、参数。当其中一个这样的内部函数在包含它们的外部函数之外被调用时,就会形成闭包。也就是说,内部函数会在外部函数返回后被执行。而当这个内部函数执行时,它仍然必需访问其外部函数的局部变量、参数以及其他内部函数。这些局部变量、参数和函数声明(最初时)的值是外部函数返回时的值,但也会受到内
系统 2019-09-27 17:54:51 2079
前面说到了urllib2的简单入门,下面整理了一部分urllib2的使用细节。1.Proxy的设置urllib2默认会使用环境变量http_proxy来设置HTTPProxy。如果想在程序中明确控制Proxy而不受环境变量的影响,可以使用代理。新建test14来实现一个简单的代理Demo:复制代码代码如下:importurllib2enable_proxy=Trueproxy_handler=urllib2.ProxyHandler({"http":'ht
系统 2019-09-27 17:54:48 2079
python里面可以将路径里面的\替换成/避免转义。os.walk方法可以将目标路径下文件的root,dirs,files提取出来。后面对每个文件进行操作。切片操作[:]判断是否为.jpg或.JPG文件。shutil的copy方法将文件从旧路径复制到新路径。glob的glob方法提取目标文件夹的所有图片,对每张图片进行显示保存等操作。详细代码及注释如下:importosimportshutilimportglobimportcv2path='C:/User
系统 2019-09-27 17:54:30 2079
设计模式的重要性,不再赘述,分方法和类型逐一记录,以备忘。一、单例模式单例模式,顾名思义,python中的某个类有且仅有一个对象(实例);1.应用场景:某个实例必须保证全局唯一性,如读取某些配置文件的实例,需要确保在任意地方都是相同配置值;2.实现方法:使用python中的基类object中__new__();3.代码:classsingleton(object):def__new__(cls,*args,**kw):ifnothasattr(cls,'_
系统 2019-09-27 17:52:35 2079
Sklearn简介Scikit-learn(sklearn)是机器学习中常用的第三方模块,对常用的机器学习方法进行了封装,包括回归(Regression)、降维(DimensionalityReduction)、分类(Classfication)、聚类(Clustering)等方法。当我们面临机器学习问题时,便可根据下图来选择相应的方法。Sklearn具有以下特点:简单高效的数据挖掘和数据分析工具让每个人能够在复杂环境中重复使用建立NumPy、Scipy、
系统 2019-09-27 17:51:55 2079
安装前准备(准备编译环境)yuminstallzlib-develbzip2-developenssl-develncurses-develgcc-c++gcc-y获取Python3.6源码#获取源码wgethttps://www.python.org/ftp/python/3.6.3/Python-3.6.3.tar.xz#安装xzyuminstallxz-y#解压tar-xvfPython-3.6.3.tar.xz-C/usr/local/src/安装
系统 2019-09-27 17:51:11 2079
filter(functionorNone,sequence),其中sequence可以是list,tuple,string。这个函数的功能是过滤出sequence中所有以元素自身作...filter(functionorNone,sequence),其中sequence可以是list,tuple,string。这个函数的功能是过滤出sequence中所有以元素自身作为参数调用function时返回True或bool(返回值)为True的元素并以列表返回.
系统 2019-09-27 17:50:48 2079
让我们描绘一下本文的情节:假设您要在本地机器上运行一个进程,而部分程序逻辑却在另一处。让我们特别假设这个程序逻辑会不时更新,而您运行进程时,希望使用最新的程序逻辑。有许多方法可以满足刚提到的要求;本文将向您说明其中几种方法。随着“可爱的Python”专栏不断进行,已经讨论了我的公共域实用程序Txt2Html的正在进行的增强。该实用程序将“智能ASCII”文本文件转换成HTML。以前的文章讨论了实用程序的Web代理版本和实用程序的curses界面。同样,我偶
系统 2019-09-27 17:50:18 2079
centospython3.4更新到3.6python3.4是yum安装的就直接执行命令:yumupdatepython34-y如果是通过源码安装的,就需要下3.6源码包,重新解压,编译,安装
系统 2019-09-27 17:50:00 2079