爬虫即网络爬虫,英文是WebSpider。翻译过来就是网络上爬行的蜘蛛,如果把互联网看作一张大网,那么爬虫就是在大网上爬来爬去的蜘蛛,碰到想要的食物,就把他抓取出来。我们在浏览器中输入一个网址,敲击回车,看到网站的页面信息。这就是浏览器请求了网站的服务器,获取到网络资源。那么,爬虫也相当于模拟浏览器发送请求,获得到HTML代码。HTML代码里通常包含了标签和文字信息,我们就从中提取到我们想要的信息。通常爬虫是从某个网站的某个页面开始,爬取这个页面的内容,找
系统 2019-09-27 17:51:07 1937
之前学习C语言的时候,语法之类的都不是很懂,但是已经知道3个情况---流程1.顺序编写(一步一步下去)执行按照上到下;2.判断编写。(就是如果符合什么条件,就做什么。。。。)3.循环编写。(符合特定条件,进行重复的事情)###到了python,我们上一个课,说了if,这里说循环;你不是要问顺序不说吗?自己脑补一下(不需要理会任何条件的,一个个代码执行下去,不是顺序?)for循环和while循环--------------------------------
系统 2019-09-27 17:51:03 1937
考虑这种情况:如果一个线程遇到锁嵌套的情况该怎么办,这个嵌套是指当我一个线程在获取临界资源时,又需要再次获取。根据这种情况,代码如下:复制代码代码如下:'''Createdon2012-9-8@author:walfred@module:thread.ThreadTest6'''importthreadingimporttimecounter=0mutex=threading.Lock()classMyThread(threading.Thread):de
系统 2019-09-27 17:50:55 1937
一、Python下载1、Python最新源码,二进制文档,新闻资讯等可以在Python的官网查看到:2、Python官网:https://www.python.org/3、你可以在以下链接中下载Python的文档,你可以下载HTML、PDF和PostScript等格式的文档。4、Python文档下载地址:https://www.python.org/doc/二、Window平台安装Python:1、以下为在Window平台上安装Python的简单步骤:2、
系统 2019-09-27 17:50:36 1937
迭代器和可迭代对象由for循环的内部原理说起list01=[2,434,5,6,8]foriteminlist01:print(item)大家有没有想过list类型对象为什么可以被for循环呢?能够被for循环的条件是:它是可迭代对象(iterable)。那么什么是可迭代对象呢?参考一下内置函数item()的官方说明文档:iter(object[,sentinel])返回一个iterator对象。根据是否存在第二个实参,第一个实参的解释是非常不同的。如果没
系统 2019-09-27 17:50:22 1937
Linux下安装Python3.6和第三方库如果本机安装了python2,尽量不要管他,使用python3运行python脚本就好,因为可能有程序依赖目前的python2环境,比如yum!!!!!不要动现有的python2环境!一、安装python3.61.安装依赖环境#yum-yinstallzlib-develbzip2-developenssl-develncurses-develsqlite-develreadline-develtk-develg
系统 2019-09-27 17:50:22 1937
在这个世界上,人们每天都在用Python完成着不同的工作。而文件操作,则是大家最常需要解决的任务之一。使用Python,你可以轻松为他人生成精美的报表,也可以用短短几行代码快速解析、整理上万份数据文件。当我们编写与文件相关的代码时,通常会关注这些事情:我的代码是不是足够快?我的代码有没有事半功倍的完成任务?在这篇文章中,我会与你分享与之相关的几个编程建议。我会向你推荐一个被低估的Python标准库模块、演示一个读取大文件的最佳方式、最后再分享我对函数设计的
系统 2019-09-27 17:50:22 1937
微线程领域(至少在Python中)一直都是StacklessPython才能涉及的特殊增强部分。关于Stackless的话题以及最近它经历的变化,可能本身就值得开辟一个专栏了。但其中简单的道理就是,在“新的Stackless”下,延续(continuation)显然是不合时宜的,但微线程还是这个项目存在的理由。这一点很复杂……刚开始,我们还是先来回顾一些内容。那么,什么是微线程呢?微线程基本上可以说是只需要很少的内部资源就可以运行的进程�D并且是在Pyth
系统 2019-09-27 17:49:59 1937
python是什么?python的中文名称是蟒蛇,是一种计算机程序设计语言;是一种动态的、面向对象的脚本语言。最初是用来编写自动化脚本的,随着版本的不断更新和语言新功能的添加,越来越多被用于独立的、大型项目的开发。python语言的特点1、简单易学2、速度快:Python的底层是用C语言写的,很多标准库和第三方库也都是用C写的,运行速度非常快。3、可移植性4、可嵌入5、易于维护6、互动模式:互动模式的支持,您可以从终端输入执行代码并获得结果的语言,互动的测
系统 2019-09-27 17:49:46 1937
python的新式类是2.2版本引进来的,我们可以将之前的类叫做经典类或者旧式类。为什么要在2.2中引进newstyleclass呢?官方给的解释是:为了统一类(class)和类型(type)。在2.2之前,比如2.1版本中,类和类型是不同的,如a是ClassA的一个实例,那么a.__class__返回‘class__main__.ClassA‘,type(a)返回总是。而引入新类后,比如ClassB是个新类,b是ClassB的实例,b.__class__
系统 2019-09-27 17:49:33 1937