emm……真实的高三暑假是,整天无事可做然后找事,于是开始学习Python好的废话不多说,进入正题由题,作为一名初学者,想要玩转爬虫这类玩意还要花很大功夫。所以我就从简单的开始:提取XKCD漫画(网页简单,提取方便)使用requests和bs4模块提取网页内容+分析html,然后再存入硬盘内首先,requests和bs4都是Python的第三方库,使用pipinstallxxx(xxx是requests和bs4)安装它们requests库最主要的方法是re
系统 2019-09-27 17:49:30 2301
实际上这是一种误读,read()并不是只能生效一次。之所以会有之生效一次的误解是因为在已经read完所有的字符后,没有重新打开(open)就接着进行了下一次read,此时指针已经移到了字符串末尾,所以不再能读取出任何字符了。'''【思考】:下面的代码会读出什么?'''a=f.read()b=f.read(-1)c=f.read(10)print(a)print(b)print(c)'''乍一看,会读出如下数据:thisisatestforthefuncti
系统 2019-09-27 17:48:35 2301
PYTHON首先要安装scapy模块PY3的安装scapy-python3,使用PIP安装就好了,注意,PY3无法使用pyinstaller打包文件,PY2正常PY2的安装scapy,比较麻烦fromscapy.allimport*pcaps=rdpcap("file.pcap")pcaps便是解析后的类似结构体的东西了packet=pcaps[0]#第1个数据包结构packet.time#数据包时间戳packet[Raw].load#PY3读取节点数据方
系统 2019-09-27 17:46:16 2301
我们很少会一次性从数据库中取出所有的数据;通常都只针对一部分数据进行操作。在DjangoAPI中,我们可以使用``filter()``方法对数据进行过滤:>>>Publisher.objects.filter(name='Apress')[]filter()根据关键字参数来转换成WHERESQL语句。前面这个例子相当于这样:SELECTid,name,address,city,state_province,country,websiteFROMbooks_
系统 2019-09-27 17:37:48 2301
核心代码:#!/usr/bin/python#-*-coding:UTF-8-*-importsmtplibimportosimportcommands,timefromemail.mime.textimportMIMEText#fromemailimportMIMETextdisk_free=os.popen('df-lh')list_disk=disk_free.read()mailto_list=["2880329185@qq.com","28812
系统 2019-09-27 17:37:38 2301
这篇文章总结了关于二叉树的创建和各种遍历方式。二叉树的创建方式通过层次遍历顺序创建先序遍历顺序(带上叶子结点标识符)创建先序顺序+中序顺序中序顺序+后序顺序二叉树的递归方式先序遍历(递归+非递归)中序遍历(递归+非递归)后序遍历(递归+非递归)广度优先遍历(BFS)首先来定义一下节点的结构classNode():def__init__(self,val):self.val=valself.left=Noneself.right=None然后定义树类clas
系统 2019-09-27 17:57:12 2300
一数据库连接fromflaskimportFlask,render_templatefromflask_sqlalchemyimportSQLAlchemy#importpymysqlapp=Flask(__name__)#配置flask配置对象中键:SQLALCHEMY_DATABASE_URIapp.config['SQLALCHEMY_DATABASE_URI']="mysql+pymysql://root:123456@localhost/pyth
系统 2019-09-27 17:56:50 2300
前一篇已经介绍过BASE页与index静态页面的开发了,但是目前index静态页面的输入框与提交按钮其实是没有任何作用的。如果需要与后台交互,还需要在数据库创建相应的表格,以及编写对应的业务逻辑去操作数据库。本篇我们暂时不去弄数据库,还是先对学生登录成功后的页面,编辑导航BASE页以及非BASE页的静态页面。之前聊过:【实战演练】Python+Django网站开发系列02-Django完整开发环境部署https://blog.51cto.com/14423
系统 2019-09-27 17:56:28 2300
本文实例讲述了Python内存管理。分享给大家供大家参考,具体如下:a=1a是引用,1是对象。Python缓存整数和短字符串,对象只有一份,但长字符串和其他对象(列表字典)则有很多对象(赋值语句创建新的对象)。fromsysimportgetrefcounta=[1,2,3]print(getfrecount(a))返回4,当使用某个引用作为参数传给getfrecount时,创建了临时引用,+1.对象引用对象classfrom_obj(object):de
系统 2019-09-27 17:55:49 2300
在上次的爬虫中,抓取的数据主要用到的是第三方的Beautifulsoup库,然后对每一个具体的数据在网页中的selecter来找到它,每一个类别便有一个select方法。对网页有过接触的都知道很多有用的数据都放在一个共同的父节点上,只是其子节点不同。在上次爬虫中,每一类数据都要从其父类(包括其父节点的父节点)上往下寻找ROI数据所在的子节点,这样就会使爬虫很臃肿,因为很多数据有相同的父节点,每次都要重复的找到这个父节点。这样的爬虫效率很低。因此,笔者在上次
系统 2019-09-27 17:49:04 2300
一、类定义:class<类名>:<语句>类实例化后,可以使用其属性,实际上,创建一个类之后,可以通过类名访问其属性如果直接使用类名修改其属性,那么将直接影响到已经实例化的对象类的私有属性:__private_attrs两个下划线开头,声明该属性为私有,不能在类地外部被使用或直接访问在类内部的方法中使用时self.__private_attrs类的方法在类地内部,使用def关键字可以为类定义一个方法,与一般函数定义不同,类方法必须包含参数self,且为第一个
系统 2019-09-27 17:48:03 2300
方法一:cmd命令行窗口首先打开windows上的cmd命令行窗口,再将目录切换到python运行的那个目录下,那怎么查看自己是在那个目录下呢?鼠标右键点击file,依次点开就可以看到运行路径。在cmd中输入:cd/dD:\py_project\code\class_practice\classs\venv\Scripts通过使用CD命令,并加入参数/d,可以通过一个步骤,直接进入指定盘符下的任意文件夹,否则还是会在系统无法切换。以安装pandas模块为例
系统 2019-09-27 17:47:19 2300
python中,list这种数据结构很常用到,如果两个或者多个list结构相同,内容类型相同,我们通常会将两个或者多个list合并成一个,这样我们再循环遍历的时候就可以一次性处理掉了。所以如何将两个或者多个list合并成一个就是我们接下来要讲的内容哦python合并list方法1,运算符:list1=[1,2,3]list2=[4,5,6]list3=list1+list2print(list3)方法2,extend()方法:list1=[1,2,3]li
系统 2019-09-27 17:38:22 2300
第2章监督学习利用graphviz打开绘制的dot格式决策图出错,有两个坑需注意1、pipinstallgraphviz库还不够,还要安装graphviz软件,地址http://www.graphviz.org/download/。2、强烈建议安装地址为C盘,安装后添加软件所在文件夹(bin)地址到PATH环境。之前安装到其他盘,运行一直出错,makesuretheGraphvizexecutablesareonyoursystems’PATH,改为C盘就
系统 2019-09-27 17:57:03 2299
requests是python实现的简单易用的HTTP库,使用起来比urllib简洁很多因为是第三方库,所以使用前需要cmd安装pipinstallrequests安装完成后import一下,正常则说明可以开始使用了。基本用法:requests.get()用于请求目标网站,类型是一个HTTPresponse类型importrequestsresponse=requests.get('http://www.baidu.com')print(response.
系统 2019-09-27 17:56:23 2299