一、分析:抓取动态页面js加载的人民日报里面的新闻详情https://wap.peopleapp.com/news/1先打开,然后查看网页源码,发现是一堆js,并没有具体的每个新闻的url详情,于是第一反应,肯定是js动态加载拼接的url。然后接着按f12查看,就看url,发现出来了好多url。然后点击具体的某一个新闻详情页面,查看url,把这个url的后面两个数字其中一个拿到访问主页的时候,f12抓包结果里面去查找,发现一个url,点击这个url,发现p
系统 2019-09-27 17:52:31 2157
一.HTTP协议1.官方概念:HTTP协议是HyperTextTransferProtocol(超文本传输协议)的缩写,是用于从万维网(WWW:WorldWideWeb)服务器传输超文本到本地浏览器的传送协议。(虽然童鞋们将这条概念都看烂了,但是也没办法,毕竟这就是HTTP的权威官方的概念解释,要想彻底理解,请客观目移下侧......)2.白话概念:HTTP协议就是服务器(Server)和客户端(Client)之间进行数据交互(相互传输数据)的一种形式。我
系统 2019-09-27 17:52:22 2157
数据集:https://archive.ics.uci.edu/ml/datasets/Adult这个数据集是字符数据集,你需要自己进行清洗数据转换数据之类的,好在python的字符串操作特别简单,好处理。特征取了学位情况、工作职业性质、工作单位之类的。朴素贝叶斯:https://www.bilibili.com/video/av36338359?from=search&seid=1177086802297258225这个的数据集是预测一个人的年薪是否能超
系统 2019-09-27 17:52:08 2157
python接入片云网短信验证申请自己的签名和模板签名和模板审核失败,就联系客服,客服会帮你通过在你的系统设置里面IP白名单,填写你的服务器ip这个ip直接取浏览器搜索ip查看接入python的相关代码importrequestsimportjsonclassYunPian(object):def__init__(self,api_key):self.api_key=api_keyself.single_send_url="https://sms.yunp
系统 2019-09-27 17:51:19 2157
事先在网上搜索了一大圈,头都大了,看到那么多文章写道在python里安装psycopg2的各种坑和各种麻烦,各种不成功。搜索了一下午,索性外出放松。晚饭后,又继续上psycopg2官网(http://initd.org/psycopg/docs/install.html)看了一些有关install的资料,感觉还是麻烦。最后上这个网(https://pypi.python.org/pypi/psycopg2/)上,准备用wheel的方式进行安装。不过在此网页
系统 2019-09-27 17:50:03 2157
欢迎添加华为云小助手微信(微信号:HWCloud002或HWCloud003),输入关键字“加群”,加入华为云线上技术讨论群;输入关键字“最新活动”,获取华为云最新特惠促销。华为云诸多技术大咖、特惠活动等你来撩!超神利器…这款工具在上篇文章当Python遇到Andriod手机,那么,万物皆可盘后,就开始准备了。为什么?首先,Qpython不支持lxml这个模块,而了解python爬虫的都知道很多爬虫的html解析都是依赖该模块的,即便Qpython的文章中
系统 2019-09-27 17:49:58 2157
下标索引a='123456'#注意下标从0开始print(a[0])#输出结果为1切片操作a='123456'#注意切片是左闭右开print(a[0:6:2])【起始值:结束值:步长】#输出结果为1351.find()检测str是否包含在mystr中如果是返回开始的索引值否则返回-1str='a'mystr='小马是最棒的a'mystr1='小马是最最棒的'print(mystr.find(str))#可选参数startend指明查找的区间默认整个字符串#
系统 2019-09-27 17:49:20 2157
DesktopNexus是我最喜爱的一个壁纸下载网站,上面有许多高质量的壁纸,几乎每天必上,每月也必会坚持分享我这个月来收集的壁纸但是DesktopNexus壁纸的下载很麻烦,而且因为壁纸会通过浏览器检测你当前分辨率来展示合适你当前分辨率的壁纸,再加上是国外的网站,速度上很不乐观。于是我写了个脚本,检测输入的页面中壁纸页面的链接,然后批量下载到指定文件夹中。脚本使用python写的,所以需要机器上安装有python。用法:$pythondesktop_ne
系统 2019-09-27 17:48:08 2157
命名空间:每一个作用域变量存储的位置,或者解释为存储作用域中变量的字典。作用:获取想查看某个作用域中的变量名、变量值。使用方法:locals()#当前命名空间1.效果图:2.代码a=10b=20#定义一个变量接收全局命名空间里的变量名、变量值global_namespace=locals()print(global_namespace)print('\n\n\n')defone():c=30d=40#定义一个变量接收局部命名空间里的变量名、变量值local
系统 2019-09-27 17:47:13 2157
图片太大了,上百张图用photoshop改太慢,就想到用python写个简单的批处理。功能简单就是把原图按比例缩小复制代码代码如下:#-*-coding:cp936-*-importImageimportglob,os#图片批处理deftimage():forfilesinglob.glob('D:\\\\1\\\\*.JPG'):filepath,filename=os.path.split(files)filterame,exts=os.path.sp
系统 2019-09-27 17:46:52 2157