Python

零基础写python爬虫之使用urllib2组件抓取网页内容

版本号:Python2.7.5,Python3改动较大,各位另寻教程。所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地。类似于使用程序模拟IE浏览器的功能,把URL作为HTTP请求的内容发送到服务器端,然后读取服务器端的响应资源。在Python中,我们使用urllib2这个组件来抓取网页。urllib2是Python的一个获取URLs(UniformResourceLocators)的组件。它以urlopen函数的形式提供了一个

系统 2019-09-27 17:46:01 2384

Python

详解在Python中处理异常的教程

什么是异常?异常是一个事件,其中一个程序,破坏程序的指令的正常流的执行过程中而发生的。一般情况下,当一个Python脚本遇到一些情况不能处理,就抛出一个异常。异常是一个Python对象,它表示一个错误。当Python脚本抛出一个异常,它必须处理异常,否则将立即终止。处理异常:如果有可能会引发异常的一些可疑的代码,就可以通过将可疑的代码在一个try块:保卫你的程序。在try块,包括以下情况except:语句,其次是代码,作为优雅的处理问题,尽可能块。语法这里

系统 2019-09-27 17:37:57 2384

Python

python base64数据加密

base64数据加密,是一种可逆的编码格式,生成的编码是ascii格式的数据,通过encode加密,decode解密。原理:1、将所有字符转化为ASCII码。2、将ASCII码转化为8位二进制。3、将二进制3个归成一组(不足3个在后边补0)共24位,再拆分成4组,每组6位。4、统一在6位二进制前补两个0凑足8位。5、将补0后的二进制转为十进制。6、从Base64编码表获取十进制对应的Base64编码。importbase64classEncodeDecod

系统 2019-09-27 17:50:29 2383

Python

python学习笔记之调用eval函数出现invalid syntax错误问题

pytho的使用和分发完全是免费的,它是一种面向对象的语言,它的。它的类模块支持多态,操作符重载和多重继承等高级概念,并且以python特有的简洁的语法和类型,OOP十分易于使用。python内置了众多预编译并可移植的功能模块,这些功能模块叫做标准库(standardlibrary)。python可以调用C和C++的库,可以被C和C++的程序调用,可以与java组件集成,可以和COM和.Net等框架进行通信,并且可以通过SOAP、XML-RPC和CORBA

系统 2019-09-27 17:38:09 2383

Python

python 编程之twisted详解及简单实例

python编程之twisted详解前言:我不擅长写socket代码。一是用c写起来比较麻烦,二是自己平时也没有这方面的需求。等到自己真正想了解的时候,才发现自己在这方面确实有需要改进的地方。最近由于项目的原因需要写一些Python代码,才发现在python下面开发socket是一件多么爽的事情。对于大多数socket来说,用户其实只要关注三个事件就可以了。这分别是创建、删除、和收发数据。python中的twisted库正好可以帮助我们完成这么一个目标,实

系统 2019-09-27 17:56:47 2382

Python

python安装requests库的实例代码

requests是python实现的简单易用的HTTP库,使用起来比urllib简洁很多因为是第三方库,所以使用前需要cmd安装pipinstallrequests安装完成后import一下,正常则说明可以开始使用了。基本用法:requests.get()用于请求目标网站,类型是一个HTTPresponse类型importrequestsresponse=requests.get('http://www.baidu.com')print(response.

系统 2019-09-27 17:56:23 2382

Python

Python win32com 操作Exce的l简单方法(必看)

实例如下:fromwin32com.clientimportDispatchimportwin32com.clientclasseasyExcel:"""AutilitytomakeiteasiertogetatExcel.Rememberingtosavethedataisyourproblem,asiserrorhandling.Operatesononeworkbookatatime."""def__init__(self,filename=None

系统 2019-09-27 17:55:26 2382

Python

Python代码大全之数组快速存储到sqlite数据库(含代码)

下面代码可以直接用于将数组数据存储到数据库中第一步准备数据定义一下列名称para_name=[‘mkey’,‘uni_int’,‘pinyin’]提供一下数据para_list=[(‘中’,‘20013’,‘zhong’),(‘国’,‘22269’,‘zhong’)]将数据存储到sqlite数据库中dbname=‘pypinyin.db’tname=‘pypinyin_dict’para2db(dbname,tname,para_name,para_lis

系统 2019-09-27 17:54:48 2382

Python

python 删除大文件中的某一行(最有效率的方法)

用python处理一个文本时,想要删除其中中某一行,常规的思路是先把文件读入内存,在内存中修改后再写入源文件。但如果要处理一个很大的文本,比如GB级别的文本时,这种方法不仅需要占用很大内存,而且一次性读入内存时耗费时间,还有可能导致内存溢出。所以,需要用另外一个思路去处理。我们可以使用open()方法把需要修改的文件打开为两个文件,然后逐行读入内存,找到需要删除的行时,用后面的行逐一覆盖。实现方式见以下代码。withopen('file.txt','r')

系统 2019-09-27 17:53:58 2382

Python

Python的logging日志打印

Python的print()能够实现将需要的信息输出在控制台上,然而当程序较为复杂,需要将大量的信息记录下来的时候,print的打印就较为不方便,因此Python引入了logging模块来记录一些想要的信息。logging相对print来说更好控制输出在哪个地方,怎么输出及控制消息级别来过滤掉那些不需要的信息。1.logging的级别关系先用一个简单的例子来了解logging的输出以及各级logger=logging.getLogger()logger.s

系统 2019-09-27 17:52:42 2382

Python

python 默认参数相关知识详解

最常见的一种形式是的是为一个或者多个参数指定默认值,这会创建一个可以使用比定义时允许的参数更少的参数调用的函数,defask_ok(prompt,retries=4,reminder='Pleasetryagain!'):whileTrue:ok=input(prompt)ifokin('y','ye','yes'):returnTrueifokin('n','no','nop','nope'):returnFalseretries=retries-1if

系统 2019-09-27 17:52:19 2382

Python

python利用wx实现界面按钮和按钮监听和字体改变的方法

wxPython是Python语言的一套优秀的GUI图形库。允许Python程序员很方便的创建完整的、功能键全的GUI用户界面。wxPython是作为优秀的跨平台GUI库wxWidgets的Python封装和Python模块的方式提供给用户的。只要介绍了如何利用wxPython实现吗按钮和对按钮的监听,并且改变了按钮的字体和颜色。python代码如下:#-*-coding:utf-8-*-importwxclassFrame(wx.Frame):def__

系统 2019-09-27 17:50:32 2382

Python

堆排序(python)

6.堆排序6.1算法思想堆排序是指利用堆这种数据结构所设计的一种排序算法。堆是一个近似完全二叉树的结构,并同时满足堆的性质:即子结点的键值或索引总是小于(或者大于)它的父节点(同层节点不进行比较)。并且一般来说,升序排列通过构造大顶堆来实现,降序排列通过构造小顶堆来实现。这种算法不用额外的空间,空间复杂度为o(1),时间复杂度为o(nlogn)6.1.1堆堆是一种完全二叉树(完全二叉树是一种除了最后一层之外的其他每一层都被完全填充,并且所有结点都保持向左对

系统 2019-09-27 17:49:40 2382

Python

Python (Win)readline和tab补全的安装方法

最近开始学Python,想直接通过命令行的方式进行学习。奈何没有Tab补全,操作实在麻烦,网上各种百度后无果(x64系统,x86的可以直接下载网上各种编译好的包)最后自己百度+加上自己的摸索,找到了在64位系统下轻松安装readline和tab补全的方法一、安装readlinecmd命令行,就会自动安装readline模块python-mpipinstallpyreadline二、编写tab.py文件保存在..\Python\Lib\tab.py例如:D:

系统 2019-09-27 17:47:11 2382

Python

python学习笔记 第三章2

time库是python中处理时间的标准库。可以表达计算机时间、提供获取系统时间并格式化输出功能、提供系统级精确计时功能及格式化输出、ti提供精确计时功能用于程序性能分析。时间获取:time()ctime()gmtime()时间格式化:strftime()striptime()程序计时:perf_counter()sleep()进度条实例:(文本进度条)需要根据程序运行不断变化,模拟一个程序进度。实现进度条:#进度条模拟importtimescale=10

系统 2019-09-27 17:57:25 2381