各行各业

利用统计进行中文分词与词性分析

利用统计进行中文分词与词性分析-IveelyLiu-博客园利用统计进行中文分词与词性分析今天,翻出了我以前在本科阶段写的一些论文,虽然有几篇没有发表。突然发现很多还是比较实用,虽然学术价值并不是很大,于是我重新整理了下,用最简单的方式,摘要了部分出来拼成此文,当然拼的原料都是自己的,本文适合初学者,如若转载,请著名版权。中文分词已经是老调重弹的话题了,传统的基于词库的分词技术应该是目前最基本的分词技术,在这里我不去深入挖掘,什么好什么不好的问题,今天我只想

系统 2019-08-12 01:31:59 2559

各行各业

about the installer

Firstly,Idescriptthefunctionstepsinstaller.Wemustchecklisenceisinstalledbeforetheinstallationofapplication.iflisenceissetuptheninstalltheapplicationdirectly.iflisenceisn’tsetupthenlisencewillinstallbeforetheapplicationautomaticall

系统 2019-08-12 09:26:54 2558

各行各业

POI往Word中插入字符串--我的实践

代码packagelili.com;importjava.io.ByteArrayInputStream;importjava.io.File;importjava.io.FileInputStream;importjava.io.FileOutputStream;importjava.io.OutputStream;importorg.apache.poi.hwpf.HWPFDocument;importorg.apache.poi.hwpf.extra

系统 2019-08-12 09:26:50 2558

各行各业

Subclipse 1.8.20 发布,Eclipse 的 SVN 插件

Subclipse1.8.20发布了,完整的改进内容请看:http://subclipse.tigris.org/subclipse_1.8.x/changes.htmlSubclipse是一个为EclipseIDE添加Subversion支持的项目。支持几乎所有版本的Eclipse。Eclipse的更新地址是:http://subclipse.tigris.org/update_1.6.xhttp://subclipse.tigris.org/updat

系统 2019-08-12 01:31:44 2558

各行各业

Selenium的PageFactory在大型项目中的应用

出路出路,走出去了,总是会有路的;困难苦难,困在家里就是难。因为最近遇到的技术问题一直没找到可行的解决办法,一直在翻看selenium的源代码,之前写测试代码的时候就是拿来即用,写什么功能啊,就按手动的操作步骤去转换,近日看到一个文章,又去wiki上查了查,觉得写的不错就记录下来了。在使用selenium做UI测试的时候,往往并不是页面的每个功能我们都要测试,总有一些经常要进行回归的功能,再细致一点的说,有一些节点是我们经常操作的,那么我从项目初期开始就进

系统 2019-08-12 09:27:25 2557

各行各业

创建带sshd服务的docker image

参考:https://docs.docker.com/examples/running_ssh_service/1.创建一个空目录用于存放Dockerfilemkdir-p/home/thm/docker/test/new_imagevimDockerfileDockerfile的内容为:FROMtanghuimin0713/ubuntu_amd64:14.04RUNapt-getupdateRUNapt-getinstall-yopenssh-serve

系统 2019-08-12 09:27:09 2557

各行各业

MyBatis学习之路之configuration配置

1.首先讲解的是MyBatis核心配置文件configuration.xml的配置一个完整的configuration.xml配置顺序如下:1properties,settings,typeAliases,typeHandlers,objectFactory,objectWrapperFactory,plugins,environments,databaseIdProvider,mappers.如果没有按照上面的标签顺序来配置,编译器会提示Theconte

系统 2019-08-12 01:33:36 2557

各行各业

应对轻度修改部署问题

应对简单页面修改部署问题为什么写这篇文章:在我维护网站的过程中,当我修改了部分界面的时候,我会重新编译,全部文件上传,我在想能不能只上传修改的文件其他文件不动;问题来了,出现分析器错误;随后我就查到解决的问题,一下就是解决的办法,希望让那些新手少走弯路!本文不涉及网站如何部署。系统介绍:XP+II5+VS2008发布方式选项:(1)只选择->允许更新此预编译站点(2)选择->允许更新此预编译站点+使用固定命名和单页程序集;接下分别讲解两种不同方式在应对.C

系统 2019-08-12 01:33:28 2557

各行各业

净室过程

净室过程未经允许,严禁转载本栏目内容本文经许可转载自软件工程专家网www.21cmm.com,未经CSDN许可,请勿随便转载,谢谢合作净室参考模型(CRM)由软件工程所(Linger和Trammell1996)提出,它为净室项目运行定义了一套完整的过程和工作产品。下图显示了CRM由14个分别对应于软件管理、规范、开发和认证的独立过程组成:1、管理过程包括项目计划、项目管理、性能改进以及工程变更。2、规范过程包括需求分析、功能规范、使用规范、使用规范、结构规

系统 2019-08-12 01:33:13 2557

各行各业

《Openstack的搭建》RHEL6.5

Openstack就是搭建一个较为完整的虚拟化平台,把一个完整的物理机划分成若干个虚拟机来跑,从而实现资源的充分利用。Openstack对硬件的要求很高,要是你的物理机内存是4G的话,虚拟机的内存给3G,一个Openstack搭建起来,你会发现你的内存几乎没有,或是被它给吃个精光,然后玩起来也不是很顺畅。Openstack对rdhat企业版6.5一下的版本支持的不是很好。redhat6.4我试着搭建了2天,手都敲困了,不是这有错就是那有错,反正事错误不断。

系统 2019-08-12 09:27:35 2556

各行各业

HDU 1704 Rank (传递闭包)

题目:http://acm.hdu.edu.cn/showproblem.php?pid=1704题意:最多能找出多少条不通的路。。。。。题目没有说明不会有回路,因为如果有回路的话,回路里的对手都不能分出胜负。。。。而杭电的数据说明了不会有回路的。传递闭包:用来求图中,任意两点是否可以通,思想类似Floyed,都是3重循环,Floyed:是否存在一个中间点,使得从起点——》中间点——》终点跟短,传递闭包:是否存在一个中间点,起点到终点本来不通的,但从起点—

系统 2019-08-12 09:26:53 2556

各行各业

cygwin的安装使用

Cygwin是一个用于Windows的类UNIXshell环境。它由两个组件组成:一个UNIXAPI库,它模拟UNIX操作系统提供的许多特性;以及Bashshell的改写版本和许多UNIX实用程序,它们提供大家熟悉的UNIX命令行界面。前一个组件是一个Windows动态链接库(DLL)。后一个组件是一组基于CygwinDLL的程序,其中许多是用未经修改的UNIX源代码编译的。它们合在一起提供大家熟悉的UNIX环境。这篇文章我们要安装Cygwin,讨论它的命

系统 2019-08-12 01:33:34 2556

各行各业

QT 4.5.2 嵌入式开发平台的搭建

QT4.5.2嵌入式开发平台的搭建系统环境:ubuntu9.04编译环境:crosstool0.43安装后生成4.1版本的arm-linux-GCC在配置之前,sudoapt-getinstallbuild-essential来安装基本的开发环境Qtx11(源码安装)安装准备建议直接下二进制程序安装。1.安装依赖的库,你也可以不转,再安装出错的时候补上。sudoapt-getinstalllibxrender-devlibxrandr-devlibxcur

系统 2019-08-12 01:32:40 2556

各行各业

九度OJ1098 字母统计

题目链接:http://ac.jobdu.com/problem.php?pid=1098题目分析:使用两个数组分别存储字母表和对应的字母出现次数。源代码:#include#includeusingnamespacestd;intmain(){charch[30]={'A','B','C','D','E','F','G','H','I','J','K','L','M','N','O','P','Q','R','S','T

系统 2019-08-12 09:27:16 2555

各行各业

yarn默认配置

namevaluedescriptionyarn.ipc.client.factory.classFactorytocreateclientIPCclasses.yarn.ipc.serializer.typeprotocolbuffersTypeofserializationtouse.yarn.ipc.server.factory.classFactorytocreateserverIPCclasses.yarn.ipc.exception.facto

系统 2019-08-12 09:27:00 2555