搜索到与相关的文章
编程技术

【分词】正向最大匹配中文分词算法

中文分词一直都是中文自然语言处理领域的基础研究。目前,网络上流行的很多中文分词软件都可以在付出较少的代价的同时,具备较高的正确率。而且不少中文分词软件支持Lucene扩展。但不管实现如何,目前而言的分词系统绝大多数都是基于中文词典的匹配算法。在这里我想介绍一下中文分词的一个最基础算法:最大匹配算法(MaximumMatching,以下简称MM算法)。MM算法有两种:一种正向最大匹配,一种逆向最大匹配。●算法思想正向最大匹配算法:从左到右将待分词文本中的几个

系统 2019-08-29 21:59:36 1964

编程技术

大数据带来的机遇与挑战

摘要:数据来源的渠道也逐渐增多,这不光包括了本地的文档、音视频,还包括了网络内容和社交媒体。大数据的时代已然来临,并给各行各业带来了根本性变革。随着物联网、移动互联网、社会化网络的快速发展,企业数据的增长迅速,半结构化及非结构化的数据将成及几何倍增长。数据来源的渠道也逐渐增多,这不光包括了本地的文档、音视频,还包括了网络内容和社交媒体。大数据的时代已然来临,并给各行各业带来了根本性变革。面对这种变革,如何实现高效的存储、如何有效地管理和利用使企业的营销管理

系统 2019-08-12 09:30:26 1964

编程技术

字符串拼接函数strcat的实现 while(*p++ !='\0

在研究strcat函数实现的时候,发现了while(*p++!=‘\0’)的大秘密,也让我发现了在上篇博客中我犯的一个错误。原以为跳出后,P指向'\0',而实际上并非如此!我按跳出后P指向'\0',结果怎么拼接都实现不了,NND。为了验证这个问题,我们先上个小程序吧:#includevoidmain(){char*p="abcdefg";while(*p++!='c');printf("%c\n",*p);}您猜打印出来的是几?结果是d。

系统 2019-08-12 09:29:59 1964

Python

python里运用私有属性和方法总结

如何在PYTHON里运用私有属性和方法classFile:def__init__(self,name):self.name=nameself.code="ABCDEF"file_A=File("file_A")#假设我们有一个类,叫做文件类,设置一个对象file_A。file_A.code#如果直接调用属性,是可以看到属性里面有什么,但是如果这是个机密的密码不能公布,是不能这么处理的。classFile:def__init__(self,name):sel

系统 2019-09-27 17:57:30 1963

Python

python如何将多个PDF进行合并

背景由于工作性质,经常面对不同的问题,某些场景下SQL+Excel、常用办公软件不能处理,这时到网上找一些案例,自己动手用python处理。后续,借此博客记录比较典型的处理过程。后续,陆续实际处理的问题,如1.合并PDF2.拆分PDF3.敏感字段MD5脱敏4.从非架构化的大文本文件中提取指定条件的记录需求工作和生活中有时会遇到将多个pdf文件,合并成一个大文件的情况。例如,扫描时,普通扫描仪或打印机一页生成一个PDF,而一份资料实际多页。Adobe的收费版

系统 2019-09-27 17:57:30 1963

Python

python下的opencv画矩形和文字注释的实现方法

画矩形函数调用:cv2.rectangle(img,pt1,pt2,color,thickness,line_type,shift)img:图像.pt1:矩形的一个顶点。pt2:矩形对角线上的另一个顶点color:线条颜色(RGB)或亮度(灰度图像)(grayscaleimage)。thickness:组成矩形的线条的粗细程度。取负值时(如CV_FILLED)函数绘制填充了色彩的矩形。line_type:线条的类型。见cvLine的描述shift:坐标点的

系统 2019-09-27 17:56:28 1963

Python

LeetCode 腾讯50题Python实现之《二叉树的最大深度》

题目给定一个二叉树,找出其最大深度。二叉树的深度为根节点到最远叶子节点的最长路径上的节点数。说明:叶子节点是指没有子节点的节点。示例:给定二叉树[3,9,20,null,null,15,7],3/920/157返回它的最大深度3。思路BFS广度优先搜索,使用双端队列deque(因为性能比另外两种Queue好得多),在大循环内对二叉树的每个层做一次遍历,range(len(queue))使只遍历当前的层,每次大循环ans加1。由于每个节点仅访问一次,所以时间

系统 2019-09-27 17:56:23 1963

Python

python网络编程实例简析

本文实例讲述了python网络编程,分享给大家供大家参考。具体方法如下:服务端代码如下:fromSocketServerimport(TCPServerasTCP,StreamRequestHandlerasSRH)fromtimeimportctimeHOST=''PORT=21567ADDR=(HOST,PORT)classMyRequestHandle(SRH):defhandle(self):print'connectingfrom..',self

系统 2019-09-27 17:56:18 1963

Python

python中的json总结

1、json.dumps:是将dict转成str2、json.dump:是将python数据保存成json3、json.load:是将文件中的json数据读取出来,转换成python数据类型

系统 2019-09-27 17:56:12 1963

Python

python实现复制大量文件功能

本文实例为大家分享了python实现复制大量文件的具体代码,供大家参考,具体内容如下本来是去项目公司拷数据,结果去了发现有500G,靠系统的复制功能怕是得好几个小时,于是回来学一手操作,话不多说上代码:说明:CopyFiles1是可以将sourceDir连子目录一起原样复制到targetDir,而CopyFiles2是在sourceDir中筛选特定格式文件,然后将其直接放在targetDir中,会很乱,但是很快importosimporttimeimpor

系统 2019-09-27 17:55:43 1963