搜索到与相关的文章
Python

python使用jieba实现中文文档分词和去停用词

阅读更多分词工具的选择:现在对于中文分词,分词工具有很多种,比如说:jieba分词、thulac、SnowNLP等。在这篇文档中,笔者使用的jieba分词,并且基于python3环境,选择jieba分词的理由是其比较简单易学,容易上手,并且分词效果还很不错。分词前的准备:待分词的中文文档存放分词之后的结果文档中文停用词文档(用于去停用词,在网上可以找到很多)分词之后的结果呈现:图1去停用词和分词前的中文文档图2去停用词和分词之后的结果文档分词和去停用词代码

系统 2019-09-27 17:47:54 2426

Python

python实现两个经纬度点之间的距离和方位角的方法

最近做有关GPS轨迹上有关的东西,花费心思较多,对两个常用的函数总结一下,求距离和求方位角,比较精确,欢迎交流!1.求两个经纬点的方位角,P0(latA,lonA),P1(latB,lonB)(很多博客写的不是很好,这里总结一下)defgetDegree(latA,lonA,latB,lonB):"""Args:pointp1(latA,lonA)pointp2(latB,lonB)Returns:bearingbetweenthetwoGPSpoints

系统 2019-09-27 17:47:46 2426

Python

手写一个python迭代器过程详解

分析我们都知道一个可迭代对象可以通过iter()可以返回一个迭代器。如果想要一个对象称为可迭代对象,即可以使用for,那么必须实现__iter__()方法。在一个类的实例对象想要变成迭代器,就必须实现__iter__()和__next__()方法。调用iter()时,在对象内部默认调用__iter__(),即__iter__()的返回值应该是一个迭代器。for的每次循环中或者next()时,都是自动调用迭代器的__next__()方法,并有一个返回值。实现

系统 2019-09-27 17:46:55 2426

Python

Python的string模块中的Template类字符串模板用法

string.Template()string.Template()内添加替换的字符,使用"$"符号,或在字符串内,使用"${}";调用时使用string.substitute(dict)函数.可以通过继承"string.Template",覆盖变量delimiter(定界符)和idpattern(替换格式),定制不同形式的模板.代码:#-*-coding:utf-8-*-importstringtemplate_text='''''Delimiter:%

系统 2019-09-27 17:38:10 2426

SqlServer

SQL Server 存储过程的分页方案比拼

转自:http://blog.csdn.net/lihonggen0/archive/2004/09/14/103511.aspx1SQLServer存储过程的分页,这个问题已经讨论过几年了,很多朋友在问我,所以在此发表一下我的观点2建立表:34CREATETABLE[TestTable](5[ID][int]IDENTITY(1,1)NOTNULL,6[FirstName][nvarchar](100)COLLATEChinese_PRC_CI_ASNU

系统 2019-08-29 23:47:26 2426

编程技术

js大全

事件源对象捕获释放event.srcElement.setCapture();event.srcElement.releaseCapture();事件按键event.keyCodeevent.shiftKeyevent.altKeyevent.ctrlKey事件返回值event.returnValue鼠标位置event.xevent.y窗体活动元素document.activeElement绑定事件document.captureEvents(Event.

系统 2019-08-29 23:39:31 2426

Oracle

Oracle分析函数六——数据分布函数及报表函数

原创于2009年08月02日,2009年10月22日迁移至此。Oracle分析函数——数据分布函数及报表函数CUME_DIST功能描述:计算一行在组中的相对位置,CUME_DIST总是返回大于0、小于或等于1的数,该数表示该行在N行中的位置。例如,在一个3行的组中,返回的累计分布值为1/3、2/3、3/3SAMPLE:下例中计算每个部门的员工按薪水排序依次累积出现的分布百分比SELECTdepartment_id,first_name||''||last_

系统 2019-08-29 23:27:42 2426

SqlServer

SQLSERVER,不使用BCP,把查询结果输出为txt文

SQLSERVER,不使用BCP,把查询结果输出为txt文本文件的存储过程由于有些服务器上,数据库由于服务器安全问题,禁用了cmd_shell不能用BCP进行查询结果文本化输出。所以特写了个存储过程。用于生成文本文件SETQUOTED_IDENTIFIERONGOSETANSI_NULLSONGOALTERPROCEDUREstp_ExportDataToTxt/**//*******************************************

系统 2019-08-29 23:04:10 2426

编程技术

lucene开源中文分词器 IKAnalyzer2.0.2 共享及

最新版IKAnalyzer3.0已发布,详细请浏览:http://linliangyi2007.iteye.com/blog/429960客户词典扩展API,补充说明:类:org.mira.lucene.analysis.dict.Dictionary方法:publicstaticvoidloadExtendWords(ListwordList)(PS:实际上该API一直存在于v2.0.2,都怪俺没做好API文档,自己汗一下)使用说明:IKAnalyzer

系统 2019-08-29 22:57:43 2426

编程技术

一款小巧精致的编辑和编译工具--TextPad

昨天偶尔试用了一款编辑和编译工具--TextPad,,最新版为5.4.0,大约2.8M大小。下载地址为http://www.textpad.com/它可以支持目前主流的C#、Java、PHP,甚至古老的Perl等的编辑及编译。跟以前用的NotePad++有点类似。最主要的是它对配置较低的机器提供了一个选择,起码可以在不用装vs/eclipse/netbeans等庞然大物的前提下可以进行编辑和编译。如果常用VS环境,那么偶尔编译下Java,或者常用Eclip

系统 2019-08-29 22:21:17 2426