搜索到与相关的文章
Python

python爬虫开发第一步——熟悉网络编程,python线程与进程

最近博主手上有一个爬虫项目,开始深入研究python爬虫开发,这是我篇博客也相当于是我的学习笔记,我认为学习爬虫第一步,先学习python多线程与多进程,熟悉网络编程,接下来会陆续以博客的方式跟大家做分享。多进程Python实现多进程的方式主要有两种,一种方法是使用os模块中的fork方法,另一种方法是使用multiprocessing模块。这两种方法的区别在于前者仅适用于Unix/Linux操作系统,对Windows不支持,后者则是跨平台的实现方式,目前

系统 2019-09-27 17:53:30 1882

Python

处理Selenium3+python3定位鼠标悬停才显示的元素

先给大家介绍下Selenium3+python3--如何定位鼠标悬停才显示的元素定位鼠标悬停才显示的元素,要引入新模块#coding:utf-8fromseleniumimportwebdriverfromselenium.webdriver.common.action_chainsimportActionChainsdriver=webdriver.Firefox()driver.get("http://www.baidu.com")#定位百度页面上鼠标

系统 2019-09-27 17:53:11 1882

Python

Python字符串对象实现原理详解

在Python世界中将对象分为两种:一种是定长对象,比如整数,整数对象定义的时候就能确定它所占用的内存空间大小,另一种是变长对象,在对象定义时并不知道是多少,比如:str,list,set,dict等。>>>importsys>>>sys.getsizeof(1000)28>>>sys.getsizeof(2000)28>>>sys.getsizeof("python")55>>>sys.getsizeof("java")53如上,整数对象所占用的内存都是

系统 2019-09-27 17:52:10 1882

Python

python如何删除文件中重复的字段

本文实例为大家分享了python如何删除文件中重复字段的具体代码,供大家参考,具体内容如下原文件内容放在list中,新文件内容按行查找,如果没有出现在list中则写入第三个文件中。importcsvfiletxt1='E:/gg/log/log1.txt'filecsv1='E:/gg/log/log1.csv'filecsv2='E:/gg/log/log2.csv'filecsv3='E:/gg/log/log3.csv'classoperFileCs

系统 2019-09-27 17:50:51 1882

Python

Python实用工具FuckIt.py介绍

说起Python强大的地方,你可能想到是它的优雅、简洁、开发速度快,社区活跃度高。但真正使得这门语言经久不衰的一个重要原因是它的无所不能,因为社区有各种各样的第三库,使得我们用Python实现一个东西实在是太简单了,你经常会看到几行代码实现爬虫,10行代码实现人脸识别,虽然有些夸张,但确实就是有这样的库帮你把所有的繁文缛节全部封装了,最后给你开放一个优雅的API。今天给你推荐的这个库叫“FuckIt.py”,名字一看就是很黄很暴力的那种,作者是这样介绍它的

系统 2019-09-27 17:50:33 1882

Python

python对日志进行处理的实例代码

平时做数据处理基本离不了日志记录功能。每次都配置一堆挺烦人,索性封装个模块,这里记录一下,与大家共享。说明本日志模块目前只有一个方法getLogger,其他配置项通过参数传递,包括日志文件名,等级,日志文件划分方式,日志清除配置,日志格式等。logger.pyimportloggingfromloggingimporthandlers#日志级别字典__level_dict={'critical':logging.CRITICAL,'fatal':loggi

系统 2019-09-27 17:50:32 1882

Python

python 元类编程

元类编程装饰器任何时候你定义装饰器的时候,都应该使用functools库中的@wraps装饰器来注解底层包装函数.因为一个普通装饰器作用在某个函数上时,这个函数的重要的元信息比如名字、文档字符串、注解和参数签名都会丢失。但是@wraps不会。importtimefromfunctoolsimportwrapsdeftimethis(func):'''Decoratorthatreportstheexecutiontime.'''@wraps(func)de

系统 2019-09-27 17:50:24 1882

Python

Python时间模块小结(time and datetime)

表示时间的三种方式在Python中,通常有三种方式表示时间:时间戳,元祖(struct_time),格式化时间字符串。时间戳(timestamp):1970年1月1日00:00:00开始按秒计算的偏移量,type(time.time())float类型格式化时间字符串(FormatString):'1999-12-06'时间元组(stuct_time):共有9个元素(年月日时分秒,一年中的第几周,一年中第几天等)几种时间格式的转换#结构化时间-->%a%b

系统 2019-09-27 17:49:55 1882

Python

Python 之父的解析器系列之五:左递归 PEG 语法

原题|Left-recursivePEGgrammars作者|GuidovanRossum(Python之父)译者|豌豆花下猫(“Python猫”公众号作者)声明|本翻译是出于交流学习的目的,基于CCBY-NC-SA4.0授权协议。为便于阅读,内容略有改动。我曾几次提及左递归是一块绊脚石,是时候去解决它了。基本的问题在于:使用递归下降解析器时,左递归会因堆栈溢出而导致程序终止。【这是我的PEG系列的第5部分。其它文章参见这个目录】假设有如下的语法规则:ex

系统 2019-09-27 17:49:40 1882

Python

Anaconda多环境多版本python配置操作方法

conda测试指南在开始这个conda测试之前,你应该已经下载并安装好了Anaconda或者Miniconda注意:在安装之后,你应该关闭并重新打开windows命令行。一、Conda测试过程:使用conda。首先我们将要确认你已经安装好了conda配置环境。下一步我们将通过创建几个环境来展示conda的环境管理功能。使你更加轻松的了解关于环境的一切。我们将学习如何确认你在哪个环境中,以及如何做复制一个环境作为备份。测试python。然后我们将检查哪一个版

系统 2019-09-27 17:48:14 1882