部分转载:http://www.blogjava.net/zhenandaci/archive/2008/05/31/204646.html作者:Jasper文本分类(textcategorization)问题就是将一篇文档归入预先定义的几个类别中的一个或几个,而文本的自动分类则是使用计算机程序来实现这样的分类。通俗点说,就好比你拿一篇文章,问计算机这文章要说的究竟是体育,经济还是教育,计算机答不上就打它的屁屁(……)。注意这个定义当中着重强调的两个事实。
系统 2019-08-29 21:59:32 1805
twitter在国外发展迅猛,被众人看好。于是国内模仿者鹊起。饭否,叽歪,嘀咕等。其实网站都发展一段时间了,现在注册都有点落伍了。呵呵。功能都还不错,都支持和QQ,手机,MSN等绑定,适合中国用户,甚至叽歪还能和飞信绑定,不过昨天绑定飞信,“叽歪小弟”一直没自动验证通过我。呵呵。初体验感觉基本是纯模仿twitter,自己创新的东西如功能,界面等还比较少。目前叽歪比较领先,嘀咕网也奋起直追,饭否要加把劲啊,呵呵。可以通过QQ85630414在叽歪上关注我,呵
系统 2019-08-12 09:30:17 1805
第二篇《程序员必知8大排序3大查找(二)》《程序员必知8大排序3大查找(三)》每天都在叫嚣自己会什么技术,什么框架,可否意识到你每天都在被这些新名词、新技术所迷惑,.NET、XML等等技术固然诱人,可是如果自己的基础不扎实,就像是在云里雾里行走一样,只能看到眼前,不能看到更远的地方。这些新鲜的技术掩盖了许多底层的原理,要想真正的学习技术还是走下云端,扎扎实实的把基础知识学好,有了这些基础,要掌握那些新技术也就很容易了。要编写出优秀的代码同样要扎实的基础,如
系统 2019-08-12 09:30:03 1805
操作系统:macOSHighSierra10.13.3Python3.6因为此版本自带python2.7,就下载并安装了anaconda2的版本,结果使用的时候系统自带的python和anaconda里的python冲突,也就是装包的时候只在一处装了,另一处却不能使用。因此要配置环境变量,替代到系统自带的版本。python2.7总会发生中文字体乱码的情况,果断放弃,准备使用anaconda3.1.安装anaconda3在官网下载,并安装,直接都是下一步。2
系统 2019-09-27 17:57:25 1804
"""python提取文本的tfidf特征"""importmathfromcollectionsimportCounter#1.语料库corpus=['thisisthefirstdocument','thisisthesecondseconddocument','andthethirdone','isthisthefirstdocument']#2.对语料进行分词word_list=[]foriinrange(len(corpus)):word_lis
系统 2019-09-27 17:57:10 1804
第一个Python程序交互式编程交互式编程不需要创建脚本文件,是通过Python解释器的交互模式进来编写代码。linux上你只需要在命令行中输入Python命令即可启动交互式编程,提示窗口如下:$pythonPython2.7.6(default,Sep92014,15:04:36)[GCC4.2.1CompatibleAppleLLVM6.0(clang-600.0.39)]ondarwinType“help”,“copyright”,“credits”
系统 2019-09-27 17:56:51 1804
本文实例讲述了Python中unittest的用法,分享给大家供大家参考。具体用法分析如下:1.unittestmodule包含了编写运行unittest的功能,自定义的testclass都要集成unitest.TestCase类,testmethod要以test开头,运行顺序根据testmethod的名字排序,特殊方法:①setup():每个测试函数运行前运行②teardown():每个测试函数运行完后执行③setUpClass():必须使用@class
系统 2019-09-27 17:56:34 1804
八大排序算法的Python实现原文地址插入排序插入排序的基本操作就是将一个数据插入到已经排好序的有序数据中,从而得到一个新的、个数加一的有序数据,算法适用于少量数据的排序,时间复杂度为O(n^2)。是稳定的排序方法。插入算法把要排序的数组分成两部分:第一部分包含了这个数组的所有元素,但将最后一个元素除外(让数组多一个空间才有插入的位置),而第二部分就只包含这一个元素(即待插入元素)。在第一部分排序完成后,再将这个最后元素插入到已排好序的第一部分中。代码实现
系统 2019-09-27 17:55:35 1804
阅读更多注:笔记2已补全#首字母大写.title()#.append()方法:可在列表或元组末尾添加元素主要在for循环中常用#在提列表元素是的索引是从0开始,负数表示倒数,没有索引则默认是第一个元素或者最后一个元素#列表排序详细在笔记1中###for循环##可参考笔记2#for**in**:下的代码缩进则表示要循环,没缩进则不循环#“:”一定要带上#创建不同类型的数值列表a=list(range(2,5,1))#(A,B,c)指的是从A开始数(包括A)往
系统 2019-09-27 17:54:54 1804
阅读更多#1-20的列表a=list(range(1,21))print(a)#1-10000的列表squares=[]forvalueinrange(1,10001):square=valuesquares.append(square)print(squares)#1-10000的列表,核实从1开始10000结束,求1-10000之和a=list(range(1,10001))print(a)print(min(a))print(max(a))print
系统 2019-09-27 17:54:51 1804