搜索到与相关的文章
Python

python使用jieba实现中文文档分词和去停用词

阅读更多分词工具的选择:现在对于中文分词,分词工具有很多种,比如说:jieba分词、thulac、SnowNLP等。在这篇文档中,笔者使用的jieba分词,并且基于python3环境,选择jieba分词的理由是其比较简单易学,容易上手,并且分词效果还很不错。分词前的准备:待分词的中文文档存放分词之后的结果文档中文停用词文档(用于去停用词,在网上可以找到很多)分词之后的结果呈现:图1去停用词和分词前的中文文档图2去停用词和分词之后的结果文档分词和去停用词代码

系统 2019-09-27 17:47:54 2464

Java

swing学习笔记 - Desktop Java Graphics APIs:

java应用程序开发中的GUI的API的体系架构如下:AWT:是第一个和java同时推出的GUI,他调用本地库,支持鼠标和键盘的事件,有本地窗口接收到事件,转到java程序进行处理。他是swing的基础,swing中的仍然需要awt的支持,例如:cut,paste,draganddrop,keyboardfocus等java2D:他是从jdk1.2开始存在jre中的,他是一个更加广泛的功能,包括了基本和高级的操作,图片处理,文本处理,打印等。swing:他

系统 2019-08-29 23:47:36 2464

Java

深入Java集合学习系列:HashMap的实现原理(2)

5.HashMap的性能参数:HashMap包含如下几个构造器:HashMap():构建一个初始容量为16,负载因子为0.75的HashMap。HashMap(intinitialCapacity):构建一个初始容量为initialCapacity,负载因子为0.75的HashMap。HashMap(intinitialCapacity,floatloadFactor):以指定初始容量、指定的负载因子创建一个HashMap。HashMap的基础构造器Has

系统 2019-08-29 22:51:23 2464

Oracle

ORACLE分析函数学习之Windowing Aggregate Func

ORACLE在数据仓库的应用上,有很多针对分析数据和报表查询的函数。分类如下:TypeUsedForRankingCalculatingranks,percentiles,andn-tilesofthevaluesinaresultset.WindowingCalculatingcumulativeandmovingaggregates.Workswiththesefunctions:SUM,AVG,MIN,MAX,COUNT,VARIANCE,STDDE

系统 2019-08-29 22:47:00 2464

编程技术

IE 报 文档必须有一个顶层元素

今天开发了一个httpserver程序,响应包回复的是一个xml文件。结果在浏览器中访问的时候,响应的XML包却无法显示。IE一直报“文档必须有一个顶层元素”。但是检查后没发现问题,我用google浏览器访问结果也是正常的。仔细想一下应该是浏览器的问题,后来才发现原来是浏览器不支持XML所致。解决方法:开始->运行->cmd,然后按行执行以下命令.regsvr32-umsxml3.dllregsvr32msxml3.dll执行以上操作后显示正常。。。。IE

系统 2019-08-29 22:32:45 2464

编程技术

JDK6下开发WebService

周末闲来无事,在家中复习了一下JDK6下开发WebService的知识,为了加强印象,特此记录。一、样例开发环境从Java6开始,JDK中已经支持用Java开发WebService应用了,不必选用第三方包。软件及其版本JDK1.6.0_25Eclipse3.4.2JavaEE版二、样例工程结构(1)服务端com.ws.server(手工编写)(2)客户端com.ws.client(自动生成)(3)客户端调用com.ws.client.test(手工编写)。

系统 2019-08-29 22:30:18 2464

Java

Java 7 最快要到 2012 年中发布

MarkReinhold发了篇博客关于Java7的发行计划,他在这篇博客中称,目前的JDK7的发行计划完全是不现实的,主要是因为Sun被Oracle收购后增加了一些新项目(lambda,Coin,Jigsaw)导致。根据JDK7团队的估计,完整的发行版本可能要到2012年中。但MarkReinhold也指出了另外一个B计划,那就是在2012年中发布不带Jigsaw和Lambda的JDK7,该版本只会包含部分的Coin项目。然后在2012年底发布JDK8包含

系统 2019-08-29 22:16:52 2464

编程技术

药材煲汤学问多,你真的会吗

有句俗话叫:药食同源。工作辛苦不少人感觉身体发虚,想在现在这个季节补一补,很多人都会找来当归、枸杞等药材,煲一锅“滋补汤”来犒劳一下自己和家人。煲汤第一步选料:选择人参、当归、枸杞、黄芪、山药、百合、莲子等材料。另外,可根据个人身体状况选择汤料。如身体火气旺盛,可选择如绿豆、海带、冬瓜、莲子等清火、滋润类的中草药;身体寒气过盛,那么就应该选择参类作为汤料。煲汤第二步下料:肉类要先汆一下,去掉肉中残留的血水,保证煲出的汤色正。鸡要整只煲,可保证煲好汤后鸡肉质

系统 2019-08-29 22:14:44 2464

编程技术

《Effective STL》重读笔记整理

最近有闲,在工作之余重读了《effectiveSTL》一书,并通过twitter记了一下笔记,今天整理收集到这里。twitter真的非常适合记读书笔记,哈哈,以后要好好地发扬。另,我的手机还是很老的UIQ3.0的索爱手机,有没有达人推荐一些上推的应用程序?谢谢。====================================#estl第50条:熟悉与STL相关的web站点。三个:www.sgi.com/tech/stl、www.stlport.or

系统 2019-08-29 22:05:13 2464

编程技术

机房收费系统--数据库

1号建完机房收费系统的表,共9个,至于日后是否需要增加表来完善该系统,待分析.通过分析各个窗体的功能,我基本明白了各个表之间的联系.各窗体与表之间的关系如图,并按照增删改查的基本思想初步进行了分类.如有需改正的地方,还望批评指正.说起建立数据库,虽然师傅对我们要求不是那么严格,但是我想在这里弱弱的提一下三范式.第一范式满足吗?满足才是关系数据库.简言之,就是表的一列一值不重复.第二范式要求每个实例或行必须被唯一地区分,而区分各个实例完全依赖于主关键字.第三

系统 2019-08-12 09:30:14 2464