Python爬取豆瓣电影,最简单,最暴力,直接搞Api首先是api地址(地址去官网溜达一圈很容易就找到):requests.get('https://movie.douban.com/j/search_subjects?type=movie&tag={}&sort=recommend&page_limit={}&page_start=0'.format(tag,page)使用requests发送get请求拿到json数据(一次可以抓很多条,所以没必要循环抓
系统 2019-09-27 17:53:31 2301
简介python动态执行字符串代码片段(也可以是文件),一般会用到exec,eval。execexec_stmt::="exec"or_expr["in"expression[","expression]]注意:exec是一个语法声明,不是一个函数.也就是说和if,for一样.官方文档对于exec的解释ThisstatementsupportsdynamicexecutionofPythoncode.exec的第一个表达式可以是:1.代码字符串2.文件对象
系统 2019-09-27 17:53:01 2301
在接触python时最开始接触的代码,取长方形的长和宽,定义一个长方形类,然后设置长方形的长宽属性,通过实例化的方式调用长和宽,像如下代码一样。classRectangle(object):def__init__(self):self.width=10self.height=20r=Rectangle()print(r.width,r.height)此时输出结果为1020但是这样在实际使用中会产生一个严重的问题,__init__中定义的属性是可变的,换句话
系统 2019-09-27 17:52:24 2301
今天在网上看到type的一段代码,然后查了一下文档,才知道type还有三个参数的用法。http://docs.python.org/2/library/functions.html#type以前只是知道type可以检测对象类型。然后发现了一个有趣的用法。复制代码代码如下:defprintln(self):a=1+1print“%s,%s”%(self.aa,a)A=type(‘A',(),{‘aa':'printa',‘println':println})
系统 2019-09-27 17:52:10 2301
一心想学习算法,很少去真正静下心来去研究,前几天趁着周末去了解了最短路径的资料,用python写了一个最短路径算法。算法是基于带权无向图去寻找两个点之间的最短路径,数据存储用邻接矩阵记录。首先画出一幅无向图如下,标出各个节点之间的权值。其中对应索引:A――>0B――>1C――>2D――>3E――>4F――>5G――>6邻接矩阵表示无向图:算法思想是通过Dijkstra算法结合自身想法实现的。大致思路是:从起始点开始,搜索周围的路径,记录每个点到起始点的权值
系统 2019-09-27 17:51:19 2301
本节收录了稍作剪辑的PEP8摘要(PythonEnhancementProposal,Python增强提案)。PEP8由GuidovanRossum和BarryWarsaw撰写,是Python的最接近编程风格手册的东西。这里省略了一些比较具体的部分,但主要内容都已包括。应该尽可能让代码遵守PEP8规范,代码会由此更具Python风格。访问Python官方网站的文档部分并搜索PEP,就可以获得PEP8全文及Python历史上发布的所有其他PEP。PEP既是P
系统 2019-09-27 17:51:18 2301
前言在JavaWeb开发中,一般使用Zxing来生成和识别二维码,但是,Zxing的识别有点差强人意,不少相对模糊的二维码识别率很低。不过就最新版本的测试来说,识别率有了现显著提高。对比在没接触Python之前,曾使用Zbar的客户端进行识别,测了大概几百张相对模糊的图片,Zbar的识别速度要快很多,识别率也比Zxing稍微准确那边一丢丢,但是,稍微模糊一点就无法识别。相比之下,微信和支付宝的识别效果就逆天了。代码案例#-*-coding:utf-8-*-
系统 2019-09-27 17:50:56 2301
逐行读取txt文件path=r'D:\123456\1.txt'withopen(path,'r',encoding='utf-8')asf:forlineinf:value=line[:-1]#去掉换行符print(value)
系统 2019-09-27 17:56:49 2300
#代码思路:#1.实例化一个连接对象#2.实例化一个游标对象负责信息的查找和操作#3.构造sql语句#4.执行sql语句#5.如果是查询语句,则需要提取查询结果;如果是增删改操作,则需要进行提交操作#6.释放资源,关闭游标,关闭连接importpymysqlconn=pymysql.connect(host='localhost',user='root',password='123456',database='mydata',port=3306,chars
系统 2019-09-27 17:55:37 2300
5位数日期戳读取.mat文件处理里面数据时,发现里面的日期数据全部都是“5位数”数字,很不解;后来查到可以在excel中通过设置单元格调回标准日期格式,如下:选中日期戳,右键选择“格式化单元格(FormatCells)”选择需要的日期格式,点击ok即可通过代码转成标准日期例如这个DataFrame中的日期,全部都是“日期戳”格式的,但我需要的是人能看懂的“标准日期”;确认起始日期首先需拿一个“日期戳”对应的时间(标准日期),减去这个日期戳,得出起始时间。获
系统 2019-09-27 17:54:46 2300
背景:网络传输层中,一般采用TCP协议,如果要建立连接,客户端会先发送syn包请求,服务器接收,接收后,再传递给客户端ack,syn包,这个时候,客户端再次回应,传回ack包。可是问题就出在,如果我是客户端,只发送一个请求syn包,然后第三次握手的时候,不再往回传ack包,此时服务端是不是就要等待?在等待的时间里,我是不是可以伪造更多的请求,从而不断消耗服务器的资源,然后直到最后服务器停止服务为止?上述这种攻击就是syn泛洪攻击。python中scapy库
系统 2019-09-27 17:54:25 2300
Python入门之内置模块--re模块1、re模块(1)什么是正则?正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法。或者说:正则就是用来描述一类事物的规则。(在Python中)它内嵌在Python中,并通过re模块实现。正则表达式模式被编译成一系列的字节码,然后由用C编写的匹配引擎执行。元字符匹配内容\w匹配字母(包含中文)或数字或下划线\W匹配非字母(包含中文)或数字或下划线\s匹配任意的空白符\S匹配任意非空白符
系统 2019-09-27 17:52:48 2300
元组元组是不可变类型,以()表示,是任意对象的有序集合,同样是序列的一种,index和count方法分别是取元素,统计元素个数。语法比如(2,3)就是一个元组。元组与列表如此类似,为何需要重复的类型,主要它提供了不变性,提供了”常数”声明。元组项虽不能修改,但是嵌套里面的列表项还是可以修改的。文件open内置函数创建文件对象,通过这个对象对外部文件进行操作。函数有三个参数,第一个文件路径,第二个是打开模式,打开模式有三种:'r'表示读文件,'w'表示写文件
系统 2019-09-27 17:52:13 2300
1、安装PyInstallerPyInstaller的作用如标题所说,首先需要下载PyInstaller和UPX,UPX是用来压缩exe的,点击超链接下载吧,目前稳定版本是1.3,注意选择你使用的操作系统。如在Windows下,将下载解压后的upx.exe放到PyInstaller解压后的文件夹内。设PyInstaller的文件夹为D:\PyInstaller,下同。命令行下进入D:\PyInstaller,运行Configure.py,应该看到如下信息:
系统 2019-09-27 17:51:10 2300
安装模块windows:pipinstallpymysqlubuntu:sudopip3installpymysqlpython操作mysql步骤importpymysql(1)链接mysql数据库db=pymysql.connect(主机名,用户名,密码,数据库名)(2)设置字符编码db.set_charset('utf8')(3)创建游标对象cursor=db.cursor()(4)准备sql语句sql='...'(5)执行sql语句cursor.ex
系统 2019-09-27 17:51:03 2300