爬虫工作的三个基本步骤:爬取网页、解析内容、存储数据准备先安装爬取网页需要用到的第三方库:requests和bs4pipinstallrequestspipinstallbs4爬取网页#coding:UTF-8importrequestslink="http://www.santostang.com/"headers={'User-Agent':'Mozilla/5.0(WindowsNT6.1;Win64;x64)AppleWebKit/537.36(K
系统 2019-09-27 17:57:02 2188
你想过你为什么会走上学习Python这条路么?很多码农在决定学习Python的时候,大多数都没有想清楚怎么去学习这门语言,怎么学好它?这么些年,六星教育见过形形色色的学习Python的人的理由,其中不乏随大众、选个大家都学的语言等理由,这类人群有个鲜明的特点,就是一时热度高,坚持不了几天的学习便会找各种借口不上课。这是因为没有给自己定位清楚的原因。因为盲目随大众,在学习这门语言前,没有做一个基本的学习了解,所以当开始学习时,不适感会比其他有定位的同学强烈很
系统 2019-09-27 17:56:39 2188
在讲述有关list的时候,提到做游戏的事情,后来这个事情一直没有接续。不是忘记了,是在想在哪个阶段做最合适。经过一段时间学习,看官已经不是纯粹小白了,已经属于python初级者了。现在就是开始做那个游戏的时候了。游戏内容:猜数字游戏太简单了吧。是的,游戏难度不大,不过这个游戏中蕴含的东西可是值得玩味的。游戏过程描述程序运行起来,随机在某个范围内选择一个整数。提示用户输入数字,也就是猜程序随即选的那个数字。程序将用户输入的数字与自己选定的对比,一样则用户完成
系统 2019-09-27 17:56:10 2188
摘要在进行数据分析时,我们经常需要对DataFrame去重,但有时候也会需要只保留重复值。这里就简单的介绍一下对于DataFrame去重和取重复值的操作。创建DataFrame这里首先创建一个包含一行重复值的DataFrame。DataFrame去重,可以选择是否保留重复值,默认是保留重复值,想要不保留重复值的话直接设置参数keep为False即可。3.取DataFrame重复值。大多时候我们都是需要将数据去重,但是有时候很我们也需要取重复数据,这个时候我
系统 2019-09-27 17:56:02 2188
基础篇正则表达式在python中运用的非常多,因为他可以进行任意的匹配,可以匹配我们想要提取的信息。当我们接触正则的时候你就会知道正则的强大。正则有一个库re在一些工程中我们会经常调用正则的库来做与匹配相关的问题。字符串是编程时涉及到的最多的一种数据结构,对字符串进行操作的需求几乎无处不在。比如判断一个字符串是否是合法的Email地址,虽然可以编程提取@前后的子串,再分别判断是否是单词和域名,但这样做不但麻烦,而且代码难以复用。正则表达式是一种用来匹配字符
系统 2019-09-27 17:55:32 2188
Python函数编程——嵌套&匿名&高阶函数一、嵌套函数函数里不仅可以写代码,还可以嵌套函数:name="小猿圈"defchange():name="小猿圈,自学编程"defchange2():#globalname如果声明了这句,下面的name改的是最外层的全局变层name="小猿圈,自学编程不要钱"#这句注释掉的话,下面name打印的是哪个值?print("第3层打印",name)change2()#调用内层函数print("第2层打印",name)c
系统 2019-09-27 17:54:59 2188
阅读更多注:笔记2已补全#首字母大写.title()#.append()方法:可在列表或元组末尾添加元素主要在for循环中常用#在提列表元素是的索引是从0开始,负数表示倒数,没有索引则默认是第一个元素或者最后一个元素#列表排序详细在笔记1中###for循环##可参考笔记2#for**in**:下的代码缩进则表示要循环,没缩进则不循环#“:”一定要带上#创建不同类型的数值列表a=list(range(2,5,1))#(A,B,c)指的是从A开始数(包括A)往
系统 2019-09-27 17:54:53 2188
1.概述Python中asyncio模块内置了对异步IO的支持,用于处理异步IO;是Python3.4版本引入的标准库。asyncio的编程模型就是一个消息循环。我们从asyncio块中直接获取一个EventLoop的引用,然后把需要执行的协程扔到EventLoop中执行,就实现了异步IO。2.用asyncio实现Helloworld#!/usr/bin/envpython3#-*-coding:utf-8-*-#@Time:2019/1/911:23#@
系统 2019-09-27 17:54:51 2188
我们都知道验证码是一张图片,这样程序自动识别的难度大,安全性高。设计到图片,先来看一下img标签里的src属性,也是实现验证码的一个小原理我们都知道src属性可以直接把图片拿过来:比如说拿到本地的图片就在直接可以显示在页面上那它是怎么实现的呢?其实src属性同样像服务端发送了一个请求,Django服务端接收到之后,自动把本地文件读取并返回给了客户端,就实现了上面的效果下面来自己实现一下:html:#src属性是一个url,对应处理函数:deftu2(req
系统 2019-09-27 17:54:30 2188
Python在读取文件内容时的路径问题,值得深究一下.我想讨论的重点还是在绝对路径上面.在这之前我们先看一下1:相对路径这张图演示了在相对路径下寻找查找指定文件.open('相对路径演示'\'相对路径示例'.txt)打开的是相对当前运行的程序所在目录。而我当前运行的程序相对位置在桌面.所以直接print(lines)可以看到这个结果2:绝对路径.绝对路径的查找方法就不演示了,相信每个人都会找到。但是我想讨论的是几个关于路径中的编码问题,相信这对初学者们有很
系统 2019-09-27 17:52:11 2188