学用python也有3个多月了,用得最多的还是各类爬虫脚本:写过抓代理本机验证的脚本,写过在discuz论坛中自动登录自动发贴的脚本,写过自动收邮件的脚本,写过简单的验证码识别的脚本,本来想写googlemusic的抓取脚本的,结果有了强大的gmbox,也就不用写了。这些脚本有一个共性,都是和web相关的,总要用到获取链接的一些方法,再加上simplecd这个半爬虫半网站的项目,累积不少爬虫抓站的经验,在此总结一下,那么以后做东西也就不用重复劳动了。1.最
系统 2019-09-27 17:46:26 2236
我们很少会一次性从数据库中取出所有的数据;通常都只针对一部分数据进行操作。在DjangoAPI中,我们可以使用``filter()``方法对数据进行过滤:>>>Publisher.objects.filter(name='Apress')[]filter()根据关键字参数来转换成WHERESQL语句。前面这个例子相当于这样:SELECTid,name,address,city,state_province,country,websiteFROMbooks_
系统 2019-09-27 17:37:48 2236
一、python概述python语言诞生于20世纪90年代初,早期主要应用于做科学计算的研究机构。近些年由于web、大数据、人工智能的发展,它已经被逐渐广泛应用于系统管理任务的处理和web编程方面,称为比较受欢迎的程序设计语言之一。1、python的语言特点有什么?python使用C语言开发,但是python不再有C语言中的指针等复杂数据类型。python的简洁性使得软件的代码大幅度地减少,开发任务进一步简化。程序员关注的重点不再是语法特性,而是程序所要实
系统 2019-09-27 17:57:11 2235
本文实例讲述了python中元类用法,分享给大家供大家参考。具体方法分析如下:1.元类(metaclass)是用来创建类的类2.type(object):返回一个对象的类型,与object.__class__的值相同,type(name,bases,dict):创建一个新的type类型,name就是新class的name,值存到__name__属性中,bases是tuple类型,值会存到__bases__中,dict的值存到__dict__中复制代码代码如
系统 2019-09-27 17:55:31 2235
·迭代器什么是迭代器:迭代器可以让我们访问集合的时候变得非常方便。之前我们通过for…in…来访问一个集合的时候,就是使用迭代器完成的。如果没有迭代器,那么我们只能通过while循环,每次循环的时候通过下标来访问了。可迭代对象:可以直接使用for循环遍历的对象,成为可迭代的对象,常见的可迭代对象有:list、tuple、dict、set、str以及生成器更加专业的判断一个对象是否是可迭代对象:这个对象有一个__iter__方法,并且这个方法会返回一个迭代器
系统 2019-09-27 17:54:21 2235
需求:爬取搜狗首页的页面数据importrequests#1.指定urlurl='https://www.sogou.com/'#2.发起get请求:get方法会返回请求成功的响应对象response=requests.get(url=url)#3.获取响应中的数据:text属性作用是可以获取响应对象中字符串形式的页面数据page_data=response.text#4.持久化数据withopen("sougou.html","w",encoding="
系统 2019-09-27 17:53:10 2235
看着自己少得可怜的访问量,突然有一个想用爬虫刷访问量的想法,主要也是抱着尝试的心态,学习学习。其实市面上有一些软件可以代刷流量比如流量精灵,使用感确实比我们自己写的代码要好一些第一版:网上借鉴了一下以下代码运行在python3importurllib.requestimporttime#使用build_opener()是为了让python程序模仿浏览器进行访问opener=urllib.request.build_opener()opener.addhea
系统 2019-09-27 17:50:47 2235
刷票一般要突破以下限制:1、验证码识别2、同一ip不可连续投票解决办法1、用tesseract工具,链接在此https://code.google.com/p/tesseract-ocr/(人人还是加不了https链接)2、使用代理,国内可以的代理服务器可以从这里找到http://cn-proxy.com/程序语言当然用python浏览器投票的流程如下1、向服务器发送请求,服务器返回验证码和表单2、填好表单,发送到服务器可以用firefox+httpfox
系统 2019-09-27 17:50:15 2235
OpenCV是应用最被广泛的的开源视觉库。他允许你使用很少的代码来检测图片或视频中的人脸。这里有一些互联网上的教程来阐述怎么在OpenCV中使用仿射变换(affinetransform)旋转图片--他们并没有处理旋转一个图片里的矩形一般会把矩形的边角切掉这一问题,所以产生的图片需要修改。当正确的使用一点代码时,这是一点瑕疵。defrotate_about_center(src,angle,scale=1.):w=src.shape[1]h=src.shap
系统 2019-09-27 17:49:24 2235
配置Pytorch的环境,我自己着实花了很久的时间,遇到了很多的问题,问了让大家少走弯路,我这边写一下一个成功的案例。这边先要感谢一下两位博主的文章。在RaspberryPi上编译PyTorchPytorchonRaspberryPi前人种树后人乘凉,希望我的文章也能帮助到一些人。首先树莓派上面是自带了Python2.7的版本的,由于我们这边是要在Python3.5上面配置Pytotch,所以我们先安装一下Python3。sudoaptinstallpyt
系统 2019-09-27 17:48:47 2235
方法一:cmd命令行窗口首先打开windows上的cmd命令行窗口,再将目录切换到python运行的那个目录下,那怎么查看自己是在那个目录下呢?鼠标右键点击file,依次点开就可以看到运行路径。在cmd中输入:cd/dD:\py_project\code\class_practice\classs\venv\Scripts通过使用CD命令,并加入参数/d,可以通过一个步骤,直接进入指定盘符下的任意文件夹,否则还是会在系统无法切换。以安装pandas模块为例
系统 2019-09-27 17:47:19 2235
分析我们都知道一个可迭代对象可以通过iter()可以返回一个迭代器。如果想要一个对象称为可迭代对象,即可以使用for,那么必须实现__iter__()方法。在一个类的实例对象想要变成迭代器,就必须实现__iter__()和__next__()方法。调用iter()时,在对象内部默认调用__iter__(),即__iter__()的返回值应该是一个迭代器。for的每次循环中或者next()时,都是自动调用迭代器的__next__()方法,并有一个返回值。实现
系统 2019-09-27 17:46:55 2235
python中,list这种数据结构很常用到,如果两个或者多个list结构相同,内容类型相同,我们通常会将两个或者多个list合并成一个,这样我们再循环遍历的时候就可以一次性处理掉了。所以如何将两个或者多个list合并成一个就是我们接下来要讲的内容哦python合并list方法1,运算符:list1=[1,2,3]list2=[4,5,6]list3=list1+list2print(list3)方法2,extend()方法:list1=[1,2,3]li
系统 2019-09-27 17:38:22 2235
什么是异常?异常是一个事件,其中一个程序,破坏程序的指令的正常流的执行过程中而发生的。一般情况下,当一个Python脚本遇到一些情况不能处理,就抛出一个异常。异常是一个Python对象,它表示一个错误。当Python脚本抛出一个异常,它必须处理异常,否则将立即终止。处理异常:如果有可能会引发异常的一些可疑的代码,就可以通过将可疑的代码在一个try块:保卫你的程序。在try块,包括以下情况except:语句,其次是代码,作为优雅的处理问题,尽可能块。语法这里
系统 2019-09-27 17:37:57 2235
核心代码:#!/usr/bin/python#-*-coding:UTF-8-*-importsmtplibimportosimportcommands,timefromemail.mime.textimportMIMEText#fromemailimportMIMETextdisk_free=os.popen('df-lh')list_disk=disk_free.read()mailto_list=["2880329185@qq.com","28812
系统 2019-09-27 17:37:38 2235