一、注意你的Python版本Python官方网站为http://www.python.org/,当前最新稳定版本为3.6.5,在3.0版本时,Python的语法改动较大,而网上的不少教程及语法针对的是1.0或者2.0版本的,这样就造成不少初学者按照示例代码来写,但编译都无法通过的问题。1、print()函数旧的print函数用法为print‘Hello',而新的print函数对此改成了print(‘Hello')并且不再兼容之前版本。如果在3.X版本上Py
系统 2019-09-27 17:38:38 2173
Python提供多种数据类型来存放数据项集合,主要包括序列(列表list和元组tuple),映射(如字典dict),集合(set),下面对这几种一一介绍:一序列1.列表list列表是一种有序的集合,相对于元组和字符串的不同是它其中的元素可变,可以随时添加和删除其中的元素。(1)创建list在命令行中测试,如下:>>>L1=[1,2,3]>>>L1[1,2,3]>>>L2=['abc']>>>L2['abc']>>>L3=["a","b","c"]>>>L3
系统 2019-09-27 17:38:27 2173
一、网络爬虫的定义网络爬虫,即WebSpider,是一个很形象的名字。把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页的。从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。这样看来,网络爬虫
系统 2019-09-27 17:38:09 2173
近几日遇到采集某网页的时候大部分网页OK,少部分网页出现乱码的问题,调试了几日,终于发现了是含有一些非法字符造成的..特此记录1.在正常情况下..可以用importchardetthischarset=chardet.detect(strs)["encoding"]来获取该文件或页面的编码方式或直接抓取页面的charset=xxxx来获取2.遇到内容中有特殊字符时指定的编码一样会造成乱码..即内容中非法字符造成的,可以采用编码忽略非法字符的方式来处理.st
系统 2019-09-27 17:38:01 2173
准备我测试使用的Python版本为2.7.10,如果你的版本是Python3.5的话,这里就不太适合了。使用SpeechAPI原理我们的想法是借助微软的语音接口,所以我们肯定是要进行调用相关的接口。所以我们需要安装pywin32来帮助我们完成这一个底层的交互。示例代码importwin32com.clientspeaker=win32com.client.Dispatch("SAPI.SpVoice")speaker.Speak("Hello,itwork
系统 2019-09-27 17:37:43 2173
摘要:这本书看了一段时间,一直没有上手,今天刚才北京回来,新的项目需要提供一个原型,感觉比较适合ROR的开发方式,决定把《AgileWebDevelopmentwithRails》中的例子,走一遍,看一下开发的效果。阅读全文Duiker2007-03-1316:44发表评论AgileWebDevelopmentwithRails读书笔记(一)
系统 2019-08-29 23:36:56 2173
Abstractstd::string为librarytype,而int、double为built-intype,两者无法利用(int)或(double)的方式互转,本文提出轉換的方式。Introduction使用環境:VisualC++9.0/VisualStudio2008Method1:使用C的atoi()與atof()。先利用c_str()轉成Cstring,再用atoi()與atof()。string_to_double.cpp/C++1/*2(
系统 2019-08-29 23:33:55 2173
目的:导出的Excel模板,某些单元格要是文本形式,如下图我之前想当然的用cell.setCellType(HSSFCell.CELL_TYPE_STRING),但是发现没有效果。实际POI对Excel单元格格式的设置是用HSSFDataFormat这个类。如下代码可以实现设置为文本格式:HSSFCellStylecellStyle=workbook.createCellStyle();HSSFDataFormatformat=workbook.creat
系统 2019-08-29 23:33:06 2173
最早学习.net是在读大二的时候,那个时候学了一门《面向对象程序设计》的课程,那个老师很好,对于我们这一班非计算机的学生,讲得特别仔细,认真。当时用了还是2000,现在最新的版本已经是2008,不过现在比较流行的版本还是2005,以前装2000的时候,有时要装很多次才能装成功,非常的郁闷。VisualStudio.net(简称VS.net)是由微软公司开发的一套功能强大的编程工具,2002年11月13日正式推出,在这个新一代的开发平台上,微软提出了很多新的
系统 2019-08-29 23:11:06 2173
关于Query的学习。主要使用TermQuery和BooleanQuery,它们是最最基础的Query。我感觉Query的灵活性太大了,这就使得它那么地具有魅力。当用户提交了检索关键字以后,首先就是要根据这个关键字进行分析,因为不同的用户提交的关键词具有不同的特点,所以使用不同方式来构造Query是极其关键的,从而使提供的检索服务最大程度地满足用户的意愿。先看看Query抽象类的继承关系,如图所示:最简单最基础的就是构造一个TermQuery,根据词条本身
系统 2019-08-29 22:58:00 2173