最近博主手上有一个爬虫项目,开始深入研究python爬虫开发,这是我篇博客也相当于是我的学习笔记,我认为学习爬虫第一步,先学习python多线程与多进程,熟悉网络编程,接下来会陆续以博客的方式跟大家做分享。多进程Python实现多进程的方式主要有两种,一种方法是使用os模块中的fork方法,另一种方法是使用multiprocessing模块。这两种方法的区别在于前者仅适用于Unix/Linux操作系统,对Windows不支持,后者则是跨平台的实现方式,目前
系统 2019-09-27 17:53:30 1883
本来是在找交通识别的程序,然后凑巧看见了证件照换底,于是学习了一下~一开始在网上找了一个很普遍写的程序,但是效果并不好,想要放弃了,然后看见了这个,参考:pythonopencv实现证件照换底功能本人基于此做了一些改进,便于自己运行和调试,还加了中值滤波,本人觉得效果还不错~代码:importcv2importnumpyasnpdefcvtBackground(path,color):"""功能:给证件照更换背景色(常用背景色红、白、蓝)输入参数:path
系统 2019-09-27 17:53:20 1883
安装pydensecrf时报错:(venv)dorothy@dorothy-MS-7A94:~/project/venv/bin$pipinstallpydensecrfCollectingpydensecrfUsingcachedhttps://files.pythonhosted.org/packages/31/5a/1c2ab48e8019d282c128bc5c621332267bb954d32eecdda3ba57306b1551/pydense
系统 2019-09-27 17:52:21 1883
#下载一个网页importrequestsimportreurl='https://www.biquge5200.cc/14_14621/'#模拟浏览器发送http请求response=requests.get(url)#编码方式response.encoding='utf-8',如果下载下来的网页内容有中文乱码现象就需要加上这一句话#网页源码html=response.text#[0]取列表下第0个元素.#eg:title的输出结果为:['斗神狂飙无弹窗
系统 2019-09-27 17:52:18 1883
原文链接:https://www.liaoxuefeng.com/wiki/1016959663602400/1017318207388128注:本篇博客是学习廖雪峰老师网站的摘抄,是为了方便以后的学习。如有侵权,请联系删除!联系邮箱:1103540209@qq.com文章目录1.切片2.迭代3.列表生成式4.生成器5.迭代器小结参考掌握了Python的数据类型、语句和函数,基本上就可以编写出很多有用的程序了。比如构造一个1,3,5,7,...,99的列表
系统 2019-09-27 17:51:28 1883
本文实例为大家分享了python如何删除文件中重复字段的具体代码,供大家参考,具体内容如下原文件内容放在list中,新文件内容按行查找,如果没有出现在list中则写入第三个文件中。importcsvfiletxt1='E:/gg/log/log1.txt'filecsv1='E:/gg/log/log1.csv'filecsv2='E:/gg/log/log2.csv'filecsv3='E:/gg/log/log3.csv'classoperFileCs
系统 2019-09-27 17:50:51 1883
原题|Left-recursivePEGgrammars作者|GuidovanRossum(Python之父)译者|豌豆花下猫(“Python猫”公众号作者)声明|本翻译是出于交流学习的目的,基于CCBY-NC-SA4.0授权协议。为便于阅读,内容略有改动。我曾几次提及左递归是一块绊脚石,是时候去解决它了。基本的问题在于:使用递归下降解析器时,左递归会因堆栈溢出而导致程序终止。【这是我的PEG系列的第5部分。其它文章参见这个目录】假设有如下的语法规则:ex
系统 2019-09-27 17:49:40 1883
今天早上早些时候,在我的PlanetPython源中,我读到了一篇有趣的文章"开发CARDIAC:纸板计算机(Developingupwards:CARDIAC:TheCardboardComputer)",它是关于名为Cardiac的纸板计算机的.我的一些追随者和读者应该知道,我有一个名为简单CPU(simple-cpu)的项目,过去的数月我一直工作于此,并且已经发布了源代码.我真的应该给这个项目提供一个合适的许可证,这样,其他人可能更感兴趣,并在他们自
系统 2019-09-27 17:49:22 1883
一、pythongui(图形化)模块介绍:Tkinter:是python最简单的图形化模块,总共只有14种组建Pyqt:是python最复杂也是使用最广泛的图形化Wx:是python当中居中的一个图形化,学习结构很清晰Pywin:是pythonwindows下的模块,摄像头控制(opencv),常用于外挂制作二、wx模块的安装:C:\Users\Administrator>pipinstallwxpython三、图形化介绍……四、wx主要组件介绍1、fra
系统 2019-09-27 17:48:42 1883
什么是Python?Python是一种功能强大的高级编程语言,主要用于科学和工程计算。它是一种高效的语言,优雅务实,简单而强大,适合新手和专业人士的编程。Python支持多种编程范例,并提出了一个大型标准库,包括面向对象,命令式,功能性和程序性。Go是什么?Go是一种通用编程语言,由Google设计;它借鉴了许多其他许多好主意语言,同时避免导致复杂性和不可靠代码的功能。Go支持多范式,如程序,功能和并发。它的语法传统上来自C语言,但它已经做了很多修改,以改
系统 2019-09-27 17:48:01 1883
这篇文章主要介绍了python操作openpyxl导出Excel设置单元格格式及合并处理代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下贴上一个例子,里面设计很多用法,根据将相同日期的某些行合并处理。fromopenpyxlimportWorkbookfromopenpyxl.stylesimportFont,Fill,Alignment,Border,Side,PatternFillfromhan
系统 2019-09-27 17:47:12 1883
花了些工夫将碎片网部署到了SAE,中途遇到各类问题。感觉SAE看上去很美,实际上却并不是太成熟(至少python版如此)。下面记录下我遇到的一些主要问题以及解决方法。django版本问题Django1.4都即将发布了,SAE平台自带的SAE版本依旧为1.2x。为使用django1.3版本,你需上传自己的django。具体做法可参考SAE手册中的runtime.html#virtualenv日志模块出错最先遇到的是日至模块的问题。错误显示AdminEmail
系统 2019-09-27 17:46:12 1883
装饰器基本概念大家都知道装饰器是一个很著名的设计模式,经常被用于AOP(面向切面编程)的场景,较为经典的有插入日志,性能测试,事务处理,Web权限校验,Cache等。Python语言本身提供了装饰器语法(@),典型的装饰器实现如下:@function_wrapperdeffunction():pass@实际上是python2.4才提出的语法糖,针对python2.4以前的版本有另一种等价的实现:deffunction():passfunction=func
系统 2019-09-27 17:45:57 1883
python中对文件、文件夹(文件操作函数)的操作需要涉及到os模块和shutil模块。得到当前工作目录,即当前Python脚本工作的目录路径:os.getcwd()返回指定目录下的所有文件和目录名:os.listdir()函数用来删除一个文件:os.remove()删除多个目录:os.removedirs(r“c:\python”)检验给出的路径是否是一个文件:os.path.isfile()检验给出的路径是否是一个目录:os.path.isdir()判
系统 2019-09-27 17:38:36 1883
将套接字流重定向到标准输入或输出流#!/usr/bin/envpython3"""测试socket-stream重定向模式"""importsys,os,timefrommultiprocessingimportProcessfromsocketimport*definitListenerSocket(port=50008,host=''):"""初始化在服务器模式下调用者用于监听连接的套接字"""sock=socket()try:sock.bind((h
系统 2019-09-27 17:38:28 1883