所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地。在Python中有很多库可以用来抓取网页,我们先学习urllib2。urllib2是Python2.x自带的模块(不需要下载,导入即可使用)urllib2官网文档:https://docs.python.org/2/library/urllib2.htmlurllib2源码urllib2在python3.x中被改为urllib.requesturlopen我们先来段代码:#-*-
系统 2019-09-27 17:48:38 1933
一、SQLite简介SQLite是一个包含在C库中的轻量级数据库。它并不需要独立的维护进程,并且允许使用非标准变体(nonstandardvariant)的SQL查询语句来访问数据库。一些应用可是使用SQLite保存内部数据。它也可以在构建应用原型的时候使用,以便于以后转移到更大型的数据库,比如PostgreSQL或者Oracle。sqlite3模块由GerhardHäring编写,提供了一个SQL接口,这个接口的设计遵循了由PEP249描述的DB-API
系统 2019-09-27 17:47:39 1933
一、AdaBoost算法原理上一偏博客总结过,集成学习基于弱学习器之间是否依赖分为Boosting和Bagging两类,Adaboost就是Boosting中的典型代表。其核心思想是针对同一个训练集训练不同的学习器,然后将这些弱学习器集合起来,构造一个更强的最终学习算法AdaBoost是英文"AdaptiveBoosting"(自适应增强)的缩写,它的自适应在于:基于每一个分类器的误差率,来更新所有样本的权重,前一个分类器被错误分类的样本的权值会增大,而正
系统 2019-09-27 17:46:50 1933
global标识用于在函数内部,修改全局变量的值。我们可以通过以下规则,来判定一个变量到底是在全局作用域还是局部作用域:变量定义在全局作用域,那就是全局变量。变量在函数中定义,并且加了global标识,就是全局变量。如果变量在函数中仅做了定义,那么就是局部变量。如果变量在函数中仅仅是使用,那么就是全局变量。下面的示例,有助于理解上述规则:defcook():globaldumplingsdumplings='10'#全局变量print('cook():'+
系统 2019-09-27 17:46:12 1933
Python实现截屏的函数#-*-coding:cp936-*-importtime,Imageimportos,win32gui,win32ui,win32con,win32apidefwindow_capture(dpath):'''''截屏函数,调用方法window_capture('d:\\'),参数为指定保存的目录返回图片文件名,文件名格式:日期.jpg如:2009328224853.jpg'''hwnd=0hwndDC=win32gui.Get
系统 2019-09-27 17:38:39 1933
对于Python而言代码缩进是一种语法,Python没有像其他语言一样采用{}或者begin...end分隔代码块,而是采用代码缩进和冒号来区分代码之间的层次。缩进的空白数量是可变的,但是所有代码块语句必须包含相同的缩进空白数量,这个必须严格执行。例如:ifTrue:print("Hellogirl!")#缩进一个tab的占位else:#与if对齐print("Helloboy!")#缩进一个tab的占位Python对代码的缩进要求非常严格,如果不采用合理
系统 2019-09-27 17:38:32 1933
在学习python的时候,一定会遇到网站内容是通过ajax动态请求、异步刷新生成的json数据的情况,并且通过python使用之前爬取静态网页内容的方式是不可以实现的,所以这篇文章将要讲述如果在python中爬取ajax动态生成的数据。至于读取静态网页内容的方式,有兴趣的可以查看本文内容。这里我们以爬取淘宝评论为例子讲解一下如何去做到的。这里主要分为了四步:一获取淘宝评论时,ajax请求链接(url)二获取该ajax请求返回的json数据三使用python
系统 2019-09-27 17:38:05 1933
目的将一个字符转化为相应的ASCII或Unicode码,或相反的操作。方法对于ASCII码(0~255范围)复制代码代码如下:>>>printord('A')65>>>printchr(65)A对于Unicode字符,注意仅接收长度为1的Unicode字符复制代码代码如下:>>>printord(u'\u54c8')21704>>>printunichr(21704)哈>>>printrepr(unichr(21704))u'\u54c8'chr()和st
系统 2019-09-27 17:38:01 1933
FlashMX2004中的新组件对于我们开发网络应用程序的确带来了很大的方便,无论是在美观和易使用方面都得到了不错的评价。开发应用程序过程中相信大家使用的比较多的还是基于列表的组件(List、DataGrid、Tree和Menu),DataGrid、Tree和Menu组件是List类的扩展.下面引用FlashMX2004帮助文档中的一段描述。关于List类的构成List类由行构成。这些行显示滑过和选区突出显示,用作行选区的点击状态,并在滚动中扮演重要的角色
系统 2019-08-29 23:29:19 1933
!DOCTYPE指定了HTML文档遵循的文档类型定义(DTD)。Microsoft®InternetExplorer6的新增内容你可使用此声明将InternetExplorer6及以后版本切换到标准兼容模式下。语法HTML顶级元素可用性"注册//组织//类型标签//定义语言""URL"可能值顶级元素指定DTD中声明的顶级元素类型。这与声明的SGML文档类型相对应。HTML默认。HTML。可用性指定正式公开标识符(FPI)是可公开访问的对象还是系统资源。PU
系统 2019-08-29 23:02:28 1933