目的:在百度贴吧输入关键字和要查找的起始结束页,获取帖子里面楼主所发的图片思路:获取分页里面的帖子链接列表获取帖子里面楼主所发的图片链接列表保存图片到本地注意事项:问题:在谷歌浏览器使用xpathhelper插件时有匹配结果,但在程序里面使用python内带的xpath匹配却为空的原因。原因:不同服务器会对不同的浏览器返回不同的数据,导致在谷歌浏览器看到的和服务器返回的有区别解决方法:使用IE浏览器的User-agenet,而且越老的版本,报错几率相对越小
系统 2019-09-27 17:57:03 1974
家好,我是Yivies!相信大家多多少少遇到过这样的情况吧?就是在安装了python之后想完整在命令提示符直接输入python就可以使用的操作,但是会出现输入了python之后找不到命令的情况!例如这样↓↓↓但是!这并不是我们想要的结果呀!(/抓狂)我们想要它是这样子的↓↓↓怎么办呢?其实啊,这是因为你没有创建python的环境变量所导致的问题,那么怎么解决呢?那么今天就让Yivies来教大家如何解决这个问题吧!请接着往下看↓↓↓温馨提示:我这里用的是Wi
系统 2019-09-27 17:56:43 1974
文件概述若想将应用程序获取到的数据永久保存下来,就必须保存于硬盘中,操作系统把复杂的硬件操作封装成简单的接口给用户/应用程序使用,其中文件就是操作系统提供给应用程序来操作硬盘虚拟概念,用户或应用程序通过操作文件,可以将自己的数据永久保存下来。文剑操作流程打开一个文件,得到一个文件句柄并复制给变量fp=open('a.txt',mode='r',encoding='utf-8')通过文件句柄对文件进行操作data=fp.read()关闭文件fp.colse
系统 2019-09-27 17:56:38 1974
Python爬虫要经历爬虫、爬虫被限制、爬虫反限制的过程。当然后续还要网页爬虫限制优化,爬虫再反限制的一系列道高一尺魔高一丈的过程。爬虫的初级阶段,添加headers和ip代理可以解决很多问题。本人自己在爬取豆瓣读书的时候,就以为爬取次数过多,直接被封了IP.后来就研究了代理IP的问题.(当时不知道什么情况,差点心态就崩了…),下面给大家介绍一下我自己代理IP爬取数据的问题,请大家指出不足之处.问题这是我的IP被封了,一开始好好的,我还以为是我的代码问题了
系统 2019-09-27 17:56:11 1974
读取文件,将每一行作为列表的一个值,求每个字符串出现的次数,以及有哪些字符串。写入文件,按次数大小排序,次数后面对应着字符串#-*-coding:utf-8-*-input1=open('jpc.txt','r')output1=open('out.txt','w')list_of_all_the_lines=input1.read()a=list_of_all_the_lines.splitlines(False)myset=set(a)mylist_c
系统 2019-09-27 17:55:22 1974
认识模块对于模块,在前面的一些举例中,已经涉及到了,比如曾经有过:importrandom(获取随机数模块)。为了能够对模块有一个清晰的了解,首先要看看什么模块,这里选取官方文档中对它的定义:复制代码代码如下:AmoduleisafilecontainingPythondefinitionsandstatements.Thefilenameisthemodulenamewiththesuffix.pyappended.Withinamodule,themo
系统 2019-09-27 17:55:19 1974
2019-09-16-23:09:06自学Python的第六天,也是写博客的第六天今天学的内容是有关dict字典的用法看视频加上练习,目前还没遇到有难点,但是感觉很不好的样子没有难点以后突然出现一个有关字典的程序感觉要炸,还是得继续掌握看最后的代码吧,有更好的请告诉我======我======是=====一======条======快======乐======的======分======割======线======一.重要知识点1.dict用大括号{}括起
系统 2019-09-27 17:54:44 1974
本文实例为大家分享了python实现倒计时小工具的具体代码,供大家参考,具体内容如下#!/usr/bin/envpython#coding=utf-8importthreadingimporttimeimportQueuefromTkinterimport*importtkMessageBoximportlogginglogging.basicConfig(level=logging.INFO)##CommunicationqueuecommQueue=Q
系统 2019-09-27 17:54:31 1974
例子:以百度文库中选择文档的类型为例问题一:遍历点击所有文档类型的单选框#coding=utf-8fromseleniumimportwebdriverfromtimeimportsleepdriver=webdriver.Chrome()driver.maximize_window()driver.get("http://wenku.baidu.com")driver.implicitly_wait(8)foriindriver.find_element
系统 2019-09-27 17:53:47 1974
(1)常用内置数据类型分类类型名称描述数字int整数float浮点数complex复数bool布尔值序列str字符串(不可变序列)list列表tuple元组(不可变序列)range整数范围(不可变序列)bytes字节数组(不可变序列)bytearray可变字节数组映射dict字典集合set可变集合frozenset不可变集合NoneNoneType空对象,它没有任何属性(2)类型检查常用方法用法类型描述举例id(实例)内置函数返回一个对象的身份(整数)id
系统 2019-09-27 17:53:28 1974