- 军军小站|张军博客
搜索到与相关的文章
Python

Python 50行爬虫抓取并处理图灵书目过程详解

前言使用requests进行爬取、BeautifulSoup进行数据提取。主要分成两步:第一步是解析图书列表页,并解析出里面的图书详情页链接。第二步是解析图书详情页,提取出感兴趣的内容,本例中根据不同的数据情况,采用了不同的提取方法,总的感觉就是BeautifulSoup用起来很方便以下是几个典型HTML内容提取的Python代码片段1、提取详情页链接列表页中的详情页链接片段深度学习入门:基于Python的理论与实现提取详情页链接的Python代码#bs是

系统 2019-09-27 17:49:25 2014

Python

Python 学习 —— Numpy 、Pandas 傻傻分不清楚

之前的文章里面谈到过,我从R转到Python上,一个很大的不习惯就是R的数据结构比较简单,但是Python的数据类型比较多,很容易就令人头脑混乱。但是今天学习了一下Udacity的课程,顿时就清楚多了。Python最基础的数据类型包括数组、列表、字典比较常见的。而Numpy和Pandas的数据类型是在基础数据类型上建立,彼此相关,又彼此不同。Numpy里面最基本的就是一维的对象np代指,这点我认为和列表list基本没有什么不同,很多操作(比如各种的for循

系统 2019-09-27 17:49:11 2014

Python

python字符串连接的N种方式总结

python中有很多字符串连接方式,今天在写代码,顺便总结一下:最原始的字符串连接方式:str1+str2python新字符串连接语法:str1,str2奇怪的字符串方式:str1str2%连接字符串:‘name:%s;sex:'%('tom','male')字符串列表连接:str.join(some_list)第一种,想必只要是有编程经验的人,估计都知道,直接用“+”来连接两个字符串:'Jim'+'Green'='JimGreen'第二种比较特殊,如果两

系统 2019-09-27 17:47:42 2014

Python

Python中使用 Selenium 实现网页截图实例

Selenium是一个可以让浏览器自动化地执行一系列任务的工具,常用于自动化测试。不过,也可以用来给网页截图。目前,它支持Java、C#、Ruby以及Python四种客户端语言。如果你使用Python,则只需要在命令行里输入“sudoeasy_installselenium”并回车,即可安装selenium的Python版本的客户端支持。以Python为例,我们可以使用下面的脚本来给指定页面(比如脚本之家首页)截图:#-*-coding:utf-8-*-#

系统 2019-09-27 17:47:20 2014

Python

Python3 JSON 数据解析

JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。它基于ECMAScript的一个子集。Python3中可以使用json模块来对JSON数据进行编解码,它包含了两个函数:json.dumps():对数据进行编码。json.loads():对数据进行解码。importjson#Python字典类型转换为JSON对象data={'no':1,'name':'Runoob','url':'http://www.runoob.

系统 2019-09-27 17:46:18 2014

编程技术

flash MovieClip类的扩展实践

原创代码,仅为了学习flash“类”而作。欢迎提意见!先发类代码和源文件:/************人类实验制作:ybzjllj2006.1************/class人extendsMovieClip{//声明属性var头:MovieClip;var声音:Sound;//构造函数function人(){头.信息._visible=false;}//定义方法//启动眼睛的动画function眼眨(){头.右眼.play();头.左眼.play();

系统 2019-08-29 23:34:38 2014

编程技术

PL/SQL Developer 操作导出数据脚本、数据

完整的导出整个数据库表结构即dmp文件方法:Tools-->ExportTables:选择OracleExport默认选项即可,在Outputfile选择一个输出目标点击Export,即可导出表结构导出表中数据Tools-->ExportTables:选择SQLInserts遇到大字段(clob,blob)会出问题导不出来,在此可以选择需要导出的表,在Outputfile中选择导出的目标,点击Export即可导出,在此有几个选项可以去掉所有的可选项直接导出

系统 2019-08-29 23:16:30 2014

编程技术

初冬的羊肉搭配西班牙葡萄酒名角Ribera del Due

如果我能撇开女明星帕兹•维加在“露西亚的情人”当中的大胆表现的印象,谈到西班牙,让我最为怦然心动的应该是合适的葡萄酒遇上上等的烤羊排的味觉享受了。现在已经形成了某种习惯,如果我的眼前有个放着羊排的餐盘,旁边总会放着一瓶西班牙的RiberaDelDuero。这款酒和在国内比较有名的Rioja一样,是以产地命名的西班牙红酒,采用的葡萄是Tempranillo添帕尼优。在西班牙这款还有一个名字叫TintoFino,不管怎么说在RiberadelDuero地区的优

系统 2019-08-29 23:10:21 2014

编程技术

华闻传媒重大购买资产申请获审核通过

http://www.sina.com.cn2007年10月08日17:18全景网全景网10月8日讯今日,华闻传媒(000793)披露,该公司购买陕西华商传媒集团有限责任公司31.25%股权的重大购买资产申请已获得中国证监会审核无异议。据悉,该公司董事会将于2007年10月25日召开2007年第一次临时股东大会审议该重大购买资产事项。(全景网/李志锦)新浪声明:本版文章内容纯属作者个人观点,仅供投资者参考,并不构成投资建议。投资者据此操作,风险自担。华闻传

系统 2019-08-29 23:03:16 2014

编程技术

Lucene-2.2.0 源代码阅读学习(32)

关于SpanQuery(跨度搜索),它是Query的子类,但是SpanQuery仍然是一个抽象类,它有6个直接子类实现类。继承关系如图所示:其中SpanTermQuery是一个最基础的跨度搜索实现类,SpanTermQuery与SpanQuery的关系,就如同TermQuery与Query的关系:SpanTermQuery是为SpanQuery其它的具体实现子类服务的,其实TermQuery也是为Query的具体子类实现类服务的,例如构造一个Boolean

系统 2019-08-29 22:57:59 2014