部分转载:http://www.blogjava.net/zhenandaci/archive/2008/05/31/204646.html作者:Jasper文本分类(textcategorization)问题就是将一篇文档归入预先定义的几个类别中的一个或几个,而文本的自动分类则是使用计算机程序来实现这样的分类。通俗点说,就好比你拿一篇文章,问计算机这文章要说的究竟是体育,经济还是教育,计算机答不上就打它的屁屁(……)。注意这个定义当中着重强调的两个事实。
系统 2019-08-29 21:59:32 1871
通过上班闲暇时间开始学习一门脚本语言--python,很早前就有老同学建议学习一门脚本语言对未开开发会很有帮助,最初考虑选择哪门语言的时候在python和ruby中纠结了一下,最后选择python主要是感觉它的使用用户更广。开发环境我是在windows平台下开发的,python版本官方推荐的是2.7和3.3,我选择了后者,附上下载地址。事实上,对于新手来说,2.x和3.x确实有一些改变,如果你用2.x的帮助文档在3.x下开发可能会遇到一些麻烦(比如prin
系统 2019-08-12 09:30:29 1871
第二篇《程序员必知8大排序3大查找(二)》《程序员必知8大排序3大查找(三)》每天都在叫嚣自己会什么技术,什么框架,可否意识到你每天都在被这些新名词、新技术所迷惑,.NET、XML等等技术固然诱人,可是如果自己的基础不扎实,就像是在云里雾里行走一样,只能看到眼前,不能看到更远的地方。这些新鲜的技术掩盖了许多底层的原理,要想真正的学习技术还是走下云端,扎扎实实的把基础知识学好,有了这些基础,要掌握那些新技术也就很容易了。要编写出优秀的代码同样要扎实的基础,如
系统 2019-08-12 09:30:03 1871
try:print('1111')#1/0print('2222')#name#2+'3'#[][3]#{}['k']ret=int(input('number>>>'))print(ret*'*')exceptValueError:print('输入的数据类型有误')exceptException:print('你错了,老铁')else:print('没有异常的时候执行else中的代码')print('===========')deffunc():try
系统 2019-09-27 17:55:50 1870
列表(list)、元组(tuple)、集(set)、数组(array)的相互转换1.转换成list:list();2.转换成tuple:tuple()3.转换成set:set()#转换成set后,重复数据将会被删除,具体见https://blog.csdn.net/Darren1921/article/details/936315094.转换成array:array()先来看一下这四种类型的输出情况:实例1b=tuple("161561")c=list("
系统 2019-09-27 17:55:28 1870
【百度云搜索,搜各种资料:http://www.lqkweb.com】【搜网盘,搜各种资料:http://www.swpan.cn】Requests请求Requests请求就是我们在爬虫文件写的Requests()方法,也就是提交一个请求地址,Requests请求是我们自定义的**Requests()方法提交一个请求参数:url=字符串类型url地址callback=回调函数名称method=字符串类型请求方式,如果GET,POSTheaders=字典类型
系统 2019-09-27 17:54:11 1870
使用open函数,第一个参数为文件名,例如“C:\abc.txt”,这里要注意的是r“C:\abc.txt”。第二个参数为文件的操作方式,这里着重探讨写入,写入主要分为覆盖写入和追加写入。#覆盖写入例子:file=open(r'C:\abc.txt','w')file.write("abc")#写入字符串file.close#关闭文件#追加写入例子:file=open(r'C:\abc.txt','a')file.write("abc")#写入字符串fil
系统 2019-09-27 17:53:29 1870
微信订阅号:Rabbit_svip本次笔记基于python3.7在大多数编程语言中,注释都是一项非常有用且常用的功能。在python中有3种注释方法。以#号开头三个单引号(''')三个双引号(""")以#号开头#sayhiprint("HelloWorld!")print("Python~")#这是一条注释#号后面跟着的部分都属于注释。#号适合用在单行注释。三个单引号(''')和三个双引号(""")'''这是多行注释,使用单引号。这是多行注释,使用单引号。
系统 2019-09-27 17:53:23 1870
使用python爬取微博评论:本文首发于《凹凸数读》,关注后台回复“源码”获取相关python代码2019年5月27日凌晨,翟天临又上了热搜。我们爬取了翟天临2月道歉微博下的30万余条评论,看看毕业生们是如何吐槽他的?本文首发于《凹凸数读》,关注后台回复“源码”获取相关python代码
系统 2019-09-27 17:53:21 1870
在学习过程中,把开发过程中重要的一些内容备份一下,下面内容是关于python实现中文繁体和中文简体之间的相互转换的内容,应该是对码农们有所好处。#转换繁体到简体line=Converter('zh-hans').convert(line.decode('utf-8'))line=line.encode('utf-8')#转换简体到繁体line=Converter('zh-hant').convert(line.decode('utf-8'))line=li
系统 2019-09-27 17:52:50 1870
本文实例为大家分享了python微信跳一跳的具体代码,供大家参考,具体内容如下部分代码分享:wechat_jump.pyfrom__future__importprint_functionimportnumpyasnpimportmatplotlib.pyplotaspltimportmatplotlib.animationasanimationimportmathimporttimeimportosimportcv2importdatetimescale
系统 2019-09-27 17:52:45 1870
1.锁:Lock(1次放1个)同步锁线程安全,多线程操作时,内部会让所有线程排队处理。如:list/dict/Queue线程不安全+人=>排队处理。需求:a.创建100个线程,在列表中追加8b.创建100个线程v=[]锁-把自己的添加到列表中。-在读取列表的最后一个。解锁以后锁一个代码块:importthreadingimporttimev=[]lock=threading.Lock()deffunc(arg):lock.acquire()#锁的区域---
系统 2019-09-27 17:52:33 1870
我们首先来看下python的全部代码,大家可以直接复制后测试:#-*-encoding:utf-8-*-importloggingimportwmiimportosimporttimefromConfigParserimportConfigParserimportsmtplibfromemail.mime.textimportMIMETextimportsocketfromdatetimeimportdatetimeimportreimportsysimp
系统 2019-09-27 17:52:12 1870
基础版(list方法)#比较占内存w=int(input("输入一个数字还你一个斐波那契数列:"))list_res=[]deflist_n(n):ifn>=3:res=list_n(n-1)+list_n(n-2)else:res=1returnresprint("开始")foriinrange(0,w):list_res.append(list_n(i+1))print(list_res)升级版#比较占内存num=int(input("输入一个数字还你
系统 2019-09-27 17:52:01 1870
本文实例讲述了python日志logging模块使用方法。分享给大家供大家参考,具体如下:一、从一个使用场景开始开发一个日志系统,既要把日志输出到控制台,还要写入日志文件importlogging#创建一个loggerlogger=logging.getLogger('mylogger')logger.setLevel(logging.DEBUG)#创建一个handler,用于写入日志文件fh=logging.FileHandler('test.log')
系统 2019-09-27 17:51:47 1870