搜索到与相关的文章
Python

python爬虫实现教程转换成 PDF 电子书

写爬虫似乎没有比用Python更合适了,Python社区提供的爬虫工具多得让你眼花缭乱,各种拿来就可以直接用的library分分钟就可以写出一个爬虫出来,今天就琢磨着写一个爬虫,将廖雪峰的Python教程爬下来做成PDF电子书方便大家离线阅读。开始写爬虫前,我们先来分析一下该网站1的页面结构,网页的左侧是教程的目录大纲,每个URL对应到右边的一篇文章,右侧上方是文章的标题,中间是文章的正文部分,正文内容是我们关心的重点,我们要爬的数据就是所有网页的正文部分

系统 2019-09-27 17:55:45 2043

Python

Python:为什么必须在方法定义和调用中明确使用'self'?

面向对象的语言有对象。对象是状态和行为的组合。对象需要访问自己的状态。这样做基本上有两个主要选择。要么你明确地说你何时访问一个对象的状态(通过self,this或者其他类似的东西),或者语言会为你找出。让我先讨论后一种情况。存在名称冲突的问题。例如,如果对象的数据成员与方法参数的名称匹配,或者如果声明与数据成员的名称匹配的局部变量,会发生什么。您要么不允许这种情况,要么具有某种解决机制。Smalltalk是一个像这样工作的语言的例子,但我不记得语言是如何处

系统 2019-09-27 17:55:44 2043

Python

python 利用浏览器 Cookie 模拟登录的用户访问知乎的方法

首先在火狐浏览器上登录知乎,然后使用火狐浏览器插件Httpfox获取GET请求的Cookie,这里注意使用状态值为200(获取成功)的某次GET.将Cookies复制出来,注意这一行非常长,不要人为添加换行符。而且Cookie中使用了双引号,最后复制到代码里使用单引号包起来。使用下边代码检验是否是模拟了登录的用户的请求:importrequestsimportreheaders={'User-Agent':'Mozilla/5.0(WindowsNT10.

系统 2019-09-27 17:55:03 2043

Python

【跟着Head First学Python】3、结构化数据:处理结构化数据

上一章我们介绍了python中的列表,本章介绍其余三种数据结构:字典、集合和元组。1、字典字典有两个特点:其一,字典是由大括号{}包围的;其二,字典的每一个元素的模式都是“键:值”,而不是“键=值”,两个元素之间用逗号,隔开。注意,字典初始化的顺序不会保持,在初始化后,再次查看字典时,元素顺序可能变化。一般访问字典的数据时,使用中括号记法,中括号中是键,使用键来访问其关联的数据值。python字典的底层是一个大小可变的散列表。空字典的初始化就是一个空的大括

系统 2019-09-27 17:54:55 2043

Python

零基础写python爬虫之神器正则表达式

接下来准备用糗百做一个爬虫的小例子。但是在这之前,先详细的整理一下Python中的正则表达式的相关内容。正则表达式在Python爬虫中的作用就像是老师点名时用的花名册一样,是必不可少的神兵利器。一、正则表达式基础1.1.概念介绍正则表达式是用于处理字符串的强大工具,它并不是Python的一部分。其他编程语言中也有正则表达式的概念,区别只在于不同的编程语言实现支持的语法数量不同。它拥有自己独特的语法以及一个独立的处理引擎,在提供了正则表达式的语言里,正则表达

系统 2019-09-27 17:54:47 2043

Python

用 Python 加密文件

生活中,有时候我们需要对一些重要的文件进行加密,Python提供了诸如hashlib,base64等便于使用的加密库。但对于日常学习而言,我们可以借助异或操作,实现一个简单的文件加密程序,从而强化自身的编程能力。记得给公众号加个星标,不会错过精彩内容。基础知识在Python中异或操作符为:^,也可以记作XOR。按位异或的意思是:相同值异或为0,不同值异或为1。具体来讲,有四种可能:0^0=0,0^1=1,1^0=1,1^1=0。我们还可总结出规律(A为0或

系统 2019-09-27 17:54:26 2043

Python

python射线法判断检测点是否位于区域外接矩形内

本文实例为大家分享了python射线法判断点是否位于区域内的具体代码,供大家参考,具体内容如下#!/usr/bin/envpython#-*-coding:utf-8-*-#@Date:2018-10-0715:49:37#@Author:Sheldon(thisisscret@qq.com)#@Blog:谢耳朵的派森笔记#@Link:https://www.cnblogs.com/shld/#@Version:0.0.1defisinpolygon(po

系统 2019-09-27 17:54:09 2043

Python

python itchat给指定联系人发消息的方法

itchat模块官方参考文档:https://itchat.readthedocs.io/zh/latest/安装pipinstallitchat/pip3installitchat原理Python模仿网页版微信登陆,并且现有一套操作网页版微信的API,可以将你使用微信中产生的数据爬下来,并做出相应的处理。操作1.导入这套微信API的包itchatimportitchat2.模仿网页版微信登陆itchat.auto_login()3.使用相关函数找到相关微

系统 2019-09-27 17:54:06 2043

Python

python sqlite3 基本操作

创建数据库importsqlite3#连接数据库(如果不存在则创建)conn=sqlite3.connect('test.db')print("Openeddatabasesuccessfully")#创建游标c=conn.cursor()#SQL语句sql="""CREATETABLESTUDENTS(IDINTPRIMARYKEYNOTNULL,NAMETEXTNOTNULL,AGEINTNOTNULL,ADDRESSCHAR(50));"""#创建表

系统 2019-09-27 17:53:45 2043

Python

Python语法速查: 1. 数据类型与内置函数

(1)常用内置数据类型分类类型名称描述数字int整数float浮点数complex复数bool布尔值序列str字符串(不可变序列)list列表tuple元组(不可变序列)range整数范围(不可变序列)bytes字节数组(不可变序列)bytearray可变字节数组映射dict字典集合set可变集合frozenset不可变集合NoneNoneType空对象,它没有任何属性(2)类型检查常用方法用法类型描述举例id(实例)内置函数返回一个对象的身份(整数)id

系统 2019-09-27 17:53:28 2043