- 军军小站|张军博客
搜索到与相关的文章
编程技术

【分词】正向最大匹配中文分词算法

中文分词一直都是中文自然语言处理领域的基础研究。目前,网络上流行的很多中文分词软件都可以在付出较少的代价的同时,具备较高的正确率。而且不少中文分词软件支持Lucene扩展。但不管实现如何,目前而言的分词系统绝大多数都是基于中文词典的匹配算法。在这里我想介绍一下中文分词的一个最基础算法:最大匹配算法(MaximumMatching,以下简称MM算法)。MM算法有两种:一种正向最大匹配,一种逆向最大匹配。●算法思想正向最大匹配算法:从左到右将待分词文本中的几个

系统 2019-08-29 21:59:36 1922

Python

python学生管理系统

student=[]defprint_menu():print("学生管理系统V2.0")print("="*30)print("1.添加学生基本信息")print("2.通过学号删除学生信息")print("3.显示全部学生信息")print("4.通过姓名查找学生的信息")print("5.通过学号修改学生信息")print("6.导出学生基本信息到指定路径的文件中")print("7.查询成绩最高的学生基本信息")print("8.查询成绩最低的学生

系统 2019-09-27 17:56:15 1921

Python

Python:为什么必须在方法定义和调用中明确使用'self'?

面向对象的语言有对象。对象是状态和行为的组合。对象需要访问自己的状态。这样做基本上有两个主要选择。要么你明确地说你何时访问一个对象的状态(通过self,this或者其他类似的东西),或者语言会为你找出。让我先讨论后一种情况。存在名称冲突的问题。例如,如果对象的数据成员与方法参数的名称匹配,或者如果声明与数据成员的名称匹配的局部变量,会发生什么。您要么不允许这种情况,要么具有某种解决机制。Smalltalk是一个像这样工作的语言的例子,但我不记得语言是如何处

系统 2019-09-27 17:55:44 1921

Python

Python笔记004-元组的拆包和命名元组

Python笔记004-元组的拆包和命名元组以下是我学习《流畅的Python》后的个人笔记,现在拿出来和大家共享,希望能帮到各位Python学习者。首次发表于:微信公众号:科技老丁哥,ID:TechDing,敬请关注。本篇主要知识点:元组的拆包就是将元组内部的每个元素按照位置一一对应的赋值给不同变量,可以应用到变量赋值,函数参数赋值,获取元组中特定位置的元素值等场合。namedtuple:用于存储对象序列,不能改变元素值,可以像dict一样通过名字进行访问

系统 2019-09-27 17:55:37 1921

Python

详解python函数的闭包问题(内部函数与外部函数详述)

python函数的闭包问题(内嵌函数)>>>deffunc1():...print('func1running...')...deffunc2():...print('func2running...')...func2()...>>>func1()func1running...func2running...内部函数func2作用域都在外部函数func1作用域之内如果试图在外部函数的外部调用内部函数将会报错>>>func2()Traceback(mostre

系统 2019-09-27 17:54:55 1921

Python

Python3之数据指纹MD5校验与对比

MD5消息摘要算法(英语:MD5Message-DigestAlgorithm),一种被广泛使用的密码散列函数,可以产生出一个128位(16字节)的散列值(hashvalue),用于确保信息传输完整一致。MD5由美国密码学家罗纳德·李维斯特(RonaldLinnRivest)设计,于1992年公开,用以取代MD4算法。概述MD5校验码通过散列函数计算而成,可以生成任何数据的数据“指纹”,即我们可以利用MD5将消息或者数据压缩成摘要,是的数据量变小,便于比较

系统 2019-09-27 17:54:19 1921

Python

Python列表/字典操作 时间复杂度

文章目录Python列表/字典操作时间复杂度#1环境#2List#3Dict#字典的特性Python列表/字典操作时间复杂度#1环境Python3.7.3#2List操作操作说明时间复杂度index(value)查找list某个元素的索引O(1)a=index(value)索引赋值O(1)append(value)队尾添加O(1)pop()队尾删除O(1)pop(index)根据索引删除某个元素O(n)insert(index,value)根据索引插入某个

系统 2019-09-27 17:54:13 1921

Python

Python 缓存机制与 functools.lru_cache

原文链接:https://kuanghy.github.io/2016/04/20/python-cache缓存是一种将定量数据加以保存以备迎合后续请求的处理方式,旨在加快数据的检索速度。在Python的3.2版本中,引入了一个非常优雅的缓存机器,即functool模块中的lru_cache装饰器。lru_cache原型如下:@functools.lru_cache(maxsize=None,typed=False)使用functools模块的lur_ca

系统 2019-09-27 17:53:45 1921

Python

有了这本Python书后,我和她都哭了....

原文链接:https://edu.csdn.net/bundled/detail/49?utm_source=topic「超级星推官/每周分享」是一个围绕程序员生活、学习相关的推荐栏目。CSDN出品,每周发布,暂定5期。关键词:靠谱!优质!本期内容,我们将抽1人送出由我司程序员奉为“超级神作”的《疯狂Python讲义》1本,并在文章内隐藏了5门好课,敬请关注。2019年,有人说是Python元年,背靠AI和大数据,连续半年拿下TOP1编程语言,这些都给了P

系统 2019-09-27 17:53:20 1921

Python

解决Python抓HTML结构存入数据库转义报错问题

解决Python抓HTML结构存入数据库转义报错问题首先需求是这样的,抓一些资讯(带有标准的html结构入库),然后研究了半天,各种手动转义,尝试了很多种方法都没有效的解决,下面是有效的最后转义的方案,下面这种入库是没有转义符号的,和原html是一样的,如果前台需要带转义符号需要手动替换一下newSql=db.escape(param)sql='INSERTINTOzhixun(htmls)VALUES({})'.format(newSql)数据库比较懒了

系统 2019-09-27 17:53:17 1921