简介你好,当你打开这个文档的时候,我知道,你想要的是什么!Python爬虫,如何快速的学会Python爬虫,是你最期待的事情,可是这个事情应该没有想象中的那么容易,况且你的编程底子还不一定好,这套课程,没有你想要的Python基础,没有变量,循环,数组等基础知识,因为我不想在那些你可以直接快速学会的地方,去浪费你的时间。好了,这套课程是基于Python3.0以上写的,操作系统我使用的是CentOS7+所以里面的好多内容可能和你的不一样,当然也会导致许多问题
系统 2019-09-27 17:50:42 1914
文件的数据是存放于硬盘上的,因而只存在覆盖、不存在修改这么一说,我们平时看到的修改文件,都是模拟出来的效果,具体的说有两种实现方式。一、方式一将硬盘存放的该文件的内容全部加载到内存,在内存中是可以修改的,修改完毕后,再由内存覆盖到硬盘(word,vim,nodpad++等编辑器)。importoswithopen('37r.txt')asfr,\open('37r_swap.txt','w')asfw:data=fr.read()#全部读入内存,如果文件很
系统 2019-09-27 17:50:22 1914
这里先解释一下几个概念-位置参数:按位置设置的参数,隐式用元组保存对应形参.平时我们用的大多数是按位置传参.比如有函数deffunc(a,b,c),调用func(1,2,3).即a=1,b=2,c=3-关键字参数:可以通过关键字设置参数,不用关心参数位置,隐式用字典保存形参.比如有函数deffunc(a,b,c),调用func(b=1,c=2,a=3),即a=3,b=1,c=2普通格式复制代码代码如下:deffunc(opt_args):...return
系统 2019-09-27 17:50:13 1914
Python中有以下几个基本的数据类型:整数int字符串str浮点数float集合set列表list元组tuple字典dict布尔类型bool日期date其中可变数据类型有:list(列表)、dict(字典)、set(集合);不可变数据类型有:int(整型)、float(浮点型)、str(字符串)、bool(布尔类型)、tuple(元组);什么可变对象及不可变对象?不可变对象:就是说该对象所指向的内存中的值不能被改变。当改变某个变量时候,由于其所指的值不能
系统 2019-09-27 17:49:58 1914
记录三种添加cookie保持接口登录状态的方法,方便自己回顾。1.简单粗暴式。此方法比较小白,前提是已经通过fiddler抓包等方式拿到了cookie,然后直接塞进去。importrequeststrainsUrl='http://XXX.com/trains'headers={"Content-Type":"application/json;charset=UTF-8",}cookies={"XXXthor":"XXXXXX105a42"}prames=
系统 2019-09-27 17:49:54 1914
文件基本语法file=open(‘文件名’,mode)编码encoding=‘utf8’读模式存在返回True,否则抛出异常FileNotFoundError写模式存在返回True,否则新建文件mode读r写w追加a二进制b读写+操作读取所有内容read()读取一行readline()读取所有行列表readlines()关闭文件close()自动关闭withopen(目标文件)asf:存取Python对象pickle写对象dump(对象,目标文件)读对象l
系统 2019-09-27 17:49:39 1914
可视化是在整个数据挖掘的关键辅助工具,可以清晰的理解数据,从而调整我们的分析方法。1.Matplotlib基本概念Matplotlib是python的一个数据可视化工具库,专门用于开发2D图表(包括3D图表),操作简单。2.Matplotlib三层结构容器层容器层由Canvas、Figure、Axes三部分组成。Canvas位于最底层的系统层,充当画板,即放置Figure的工具。Figure是Canvas上方的第一层,也是需要用户来操作的应用层的第一层,在
系统 2019-09-27 17:49:11 1914
经历移植jinja2到python3的痛苦之后,我把项目暂时放一放,因为我怕打破python3的兼容。我的做法是只用一个python2的代码库,然后在安装的时候用2to3工具翻译成python3。不幸的是哪怕一点点的改动都会打破迭代开发。如果你选对了python的版本,你可以专心做事,幸运的避免了这个问题。来自MoinMoin项目的ThomasWaldmann通过我的python-modernize跑jinja2,并且统一了代码库,能同时跑python2,
系统 2019-09-27 17:49:06 1914
一.python是一门动态性(不用预先设置类型,变量可以随便改变值)、解释性语言(我学习用cpython解释器),可以函数式编程和面向对象编程1.用python文件名.py来运行2.初次学习用v3.73.python编程不要乱打空格号4.python语句块用冒号:二.变量1.变量名用小写2.变量名用字母、数字和下划线3.变量名不能包括空格4.常量用大写三.数据类型(不需要申明)1.整数2.浮点数3.布尔类型(只有两个值,True和False注意大写)4.空
系统 2019-09-27 17:48:35 1914
看过这篇《2000字谏言,给那些想学Python的人,建议收藏后细看!》的读者应该都对一个命令有点印象吧?没错,就是linux中经常会用到的ls命令。文章中我就提到如何提升自己的python能力呢?直接找项目写,但是作为零基础/小白/入门的你来说做一个博客还要学web框架、html、css、js,又成为了阻碍你写实际项目的阻碍。所以我就推荐了这个命令:ls。写一个ls非常简单,你只需要会一点linux的基础知识,知道ls能做什么就好了。那今天就给大家码了一
系统 2019-09-27 17:48:24 1914
最近被多线程给坑了下,没意识到类变量在多线程下是共享的,还有一个就是没意识到内存释放问题,导致越累越大1.python类变量在多线程情况下的是共享的2.python类变量在多线程情况下的释放是不完全的3.python类变量在多线程情况下没释放的那部分内存是可以重复利用的importthreadingimporttimeclassTest:cache={}@classmethoddefget_value(self,key):value=Test.cache.
系统 2019-09-27 17:48:22 1914
什么是闭包Objectsaredatawithmethodsattached.Closuresarefunctionswithdataattached.一般来说,我们都非常熟悉面向对象(OOD)语言中的对象的概念。所谓对象(Object),指的是附带相应方法的__数据__。那么相对而言,闭包(closure)指的则是附带相应数据的__函数__。换句话说,闭包函数能够引用一些并不在当前代码全局上下文中定义的变量。这些被引用的变量(称为自由变量)是在闭包函数被
系统 2019-09-27 17:48:00 1914
当年学爬虫的第一个想法就是想把双色球的数据爬下来,然后看能不能用什么牛叉的算法,或者数据分析把后面的双色球概率算出来;知道现在才抽空写了这几行代码爬取了双色球的数据,我也真是够懒的;也算是闲来无事,练手的爬虫吧;好了,多余的就不说了,直接上代码吧,代码注释已经很清楚了;importsysimportrequestsfromlxmlimportetreedefget_url(url):#请求url的方法,返回htmlheaders={'User-Agent'
系统 2019-09-27 17:47:57 1914
本文实例讲述了python读写excel文件操作。分享给大家供大家参考,具体如下:对excel文件的操作,python有第三方的工具包支持,xlutils,在这个工具包中包含了xlrd,xlwt等工具包.利用这些工具,可以方便的对excel进行操作。1.下载xlutils:http://pypi.python.org/pypi/xlutils2.安装,解压下载文件之后,可以pythonsetup.pyinstall3.应用(生成EXCEL,遍历EXCEL,
系统 2019-09-27 17:47:52 1914
本文实例讲述了Python操作Mongodb数据库的方法。分享给大家供大家参考,具体如下:一导入pymongofrompymongoimportMongoClient二连接服务器端口号27017连接MongoDB连接MongoDB我们需要使用PyMongo库里面的MongoClient,一般来说传入MongoDB的IP及端口即可,第一个参数为地址host,第二个参数为端口port,端口如果不传默认是27017。conn=MongoClient("local
系统 2019-09-27 17:47:42 1914