- 军军小站|张军博客
搜索到与相关的文章
编程技术

【分词】正向最大匹配中文分词算法

中文分词一直都是中文自然语言处理领域的基础研究。目前,网络上流行的很多中文分词软件都可以在付出较少的代价的同时,具备较高的正确率。而且不少中文分词软件支持Lucene扩展。但不管实现如何,目前而言的分词系统绝大多数都是基于中文词典的匹配算法。在这里我想介绍一下中文分词的一个最基础算法:最大匹配算法(MaximumMatching,以下简称MM算法)。MM算法有两种:一种正向最大匹配,一种逆向最大匹配。●算法思想正向最大匹配算法:从左到右将待分词文本中的几个

系统 2019-08-29 21:59:36 1834

编程技术

IP地址规划的重要性

在搭建一个局域网的时候,IP地址规划的意义重大。如果你的网络永远不会被扩展和定制,那么你可以随意的规划IP地址,只要能保证路由是通的就可以了。然而如果将来有一天你需要对已有的网络进行拓展,那么就需要精心安排地址了。原则就是:尽量使逻辑上同类的地址规划成连续的地址,并且起始地址最好是2的次幂。这样做的原因在于可以方便的划分子网。考虑下面的拓扑:有一天,需要在该局域网增加一台加密网关,所有到达外部网络2的流量都要被加密,而且需要把加密流量路由指向加密网关(流量

系统 2019-08-12 09:30:33 1834

编程技术

二叉树遍历--递归实现

递归这东西真是抽象,我看着看着算法,就囫囵吞枣地的写了下,写得囧了···这次先用递归实现先序,中序,后序遍历算法。先大概说下原理:我输入一大串字符,中间#就是代表了空,基本的储存结构就是二叉链表。主要就是二叉树的创建和三种顺序的遍历。二叉树的创建通过从左孩子开始创建不断递归,知道读取了#,开始创建对应的右孩子,继续递归。访问的时候对于三种顺序不过就是对于操作的顺序改变而已。对于下面的程序,按照图里面的二叉树建立方式:输入ABD#G###CE##FH###就

系统 2019-08-12 09:30:11 1834

编程技术

没有太多钱的互联网企业如何迅速的积累用户?

公司成立两年了,今天老板组织了一场“头脑风暴”,主要是讨论如何提升产品的竞争力,如何让公司迅速的积累更多的客户。和很多互联网公司一样我们也面临着很多困惑,产品如何定位,市场如何拓展,用户如何积累,商业模式到底如何进行,从公司成立到现在还没有百分之百的定论。还是归到本文的主题来吧,自己随便发表一点自己的看法。首先说一下没有太多钱的互联网企业的定义,它不是没有钱的互联网企业,指的是在保持现有规模的前提下,在一到两年的时间不会有资金的压力。我认为要迅速的积累用户

系统 2019-08-12 01:33:29 1834

Python

跟老齐学Python之不要红头文件(1)

这两天身体不给力,拖欠了每天发讲座的约定,看官见谅。红头文件,是某国特别色的东西,在python里不需要,python里要处理的是计算机中的文件,包括文本的、图片的、音频的、视频的等等,还有不少没见过的扩展名的,在linux中,不是所有的东西都被保存到文件中吗?文件,在python中,是一种对象,就如同已经学习过的字符串、数字等一样。先要在交互模式下查看一下文件都有哪些属性:>>>dir(file)['__class__','__delattr__','_

系统 2019-09-27 17:55:59 1833

Python

Python实现Mysql数据库连接池实例详解

python连接Mysql数据库:Python编程中可以使用MySQLdb进行数据库的连接及诸如查询/插入/更新等操作,但是每次连接MySQL数据库请求时,都是独立的去请求访问,相当浪费资源,而且访问数量达到一定数量时,对mysql的性能会产生较大的影响。因此,实际使用中,通常会使用数据库的连接池技术,来访问数据库达到资源复用的目的。数据库连接池python的数据库连接池包DBUtils:DBUtils是一套Python数据库连接池包,并允许对非线程安全的

系统 2019-09-27 17:55:24 1833

Python

Python函数编程——闭包和装饰器

Python函数编程——闭包和装饰器一、闭包关于闭包,即函数定义和函数表达式位于另一个函数的函数体内(嵌套函数)。而且,这些内部函数可以访问它们所在的外部函数中声明的所有局部变量、参数。当其中一个这样的内部函数在包含它们的外部函数之外被调用时,就会形成闭包。也就是说,内部函数会在外部函数返回后被执行。而当这个内部函数执行时,它仍然必需访问其外部函数的局部变量、参数以及其他内部函数。这些局部变量、参数和函数声明(最初时)的值是外部函数返回时的值,但也会受到内

系统 2019-09-27 17:54:51 1833

Python

Python3.6+selenium2.53.6自动化测试_读取excel

环境:编辑工具:浏览器:有问题可以联系qq:1776376537安装xlrd安装DDT一分析1目录结构2导入包二代码importxlrdclassExcelUtil():def__init__(self,excelPath,sheetName="Sheet1"):self.data=xlrd.open_workbook(excelPath)self.table=self.data.sheet_by_name(sheetName)#获取第一行作为key值se

系统 2019-09-27 17:54:09 1833

Python

python扫描proxy并获取可用代理ip的实例

今天咱写一个挺实用的工具,就是扫描并获取可用的proxy首先呢,我先百度找了一个网站:http://www.xicidaili.com作为例子这个网站里公布了许多的国内外可用的代理的ip和端口我们还是按照老样子进行分析,就先把所有国内的proxy扫一遍吧点开国内部分进行审查发现,国内proxy和目录为以下url:http://www.xicidaili.com/nn/x这个x差不多两千多页,那么看来又要线程处理了。。。老样子,我们尝试是否能直接以最简单的r

系统 2019-09-27 17:54:09 1833

Python

python GUI实例学习

在学习本篇之前,如果你对Python下进行GUI编程基础内容还有不明白,推荐一篇相关文章:简单介绍利用TK在Python下进行GUI编程的教程写一个简单的界面很容易,即使是什么都不了解的情况下,这个文本转载了最简单的界面编写,下个文本介绍了TK的简单但具体的应用在python中创建一个窗口,然后显示出来。fromTkinterimport*root=Tk()root.mainloop()就3行就能够把主窗口显示出来了。root是一个变量名称,其代表了这个主

系统 2019-09-27 17:53:14 1833