搜索到与相关的文章
Python

python网络爬虫学习笔记之一 爬虫基础入门

爬虫工作的三个基本步骤:爬取网页、解析内容、存储数据准备先安装爬取网页需要用到的第三方库:requests和bs4pipinstallrequestspipinstallbs4爬取网页#coding:UTF-8importrequestslink="http://www.santostang.com/"headers={'User-Agent':'Mozilla/5.0(WindowsNT6.1;Win64;x64)AppleWebKit/537.36(K

系统 2019-09-27 17:57:02 2199

Python

我背着女朋友,用 Python 偷偷抓取了她的行踪

1.目标场景有时候女朋友一个人在外面玩耍,问她在哪个地方,就是不告诉我。但是,你又很想知道女朋友的「位置」,这该如何是好?其实你可以这样套路女朋友,假装自己在家很无聊,可以帮她修图,让她微信发原图给你,拿到「微信原图」后,你就可以利用Python快速获取到女友的具体位置了。2.准备工作首先,在虚拟环境中安装识别图片元数据的库。pip3installexifread然后,进入高德开放平台,申请一个Web服务的应用,获取到一个「Key」用于逆地理编码API。3

系统 2019-09-27 17:56:00 2199

Python

详解python 字符串和日期之间转换 StringAndDate

python字符串和日期之间转换StringAndDate这里给出实现代码,直接可以使用。大家可以看下。实例代码:'''''Createdon2013-7-25@author:Administrator'''fromdatetimeimportdatetimeclassStringAndDate(object):'''''StringtoDate(datetime)ordatetostring'''defstringToDate(self,string):

系统 2019-09-27 17:55:46 2199

Python

Appium+python自动化(三十一)- 元芳,你怎么看? - 日志收集

简介生活中的日志是记录你生活的点点滴滴,让它把你内心的世界表露出来,更好的诠释自己的内心世界,而电脑里的日志是有价值的信息宝库。日志文件是专门用于记录系统操作事件的记录文件或文件集合,操作系统有操作系统日志文件,数据库系统有数据库系统日志文件,等等。系统日志文件是包含关于系统消息的文件,包括内核、服务、在系统上运行的应用程序等。不同的日志文件记载不同的信息。例如,有的是默认的系统日志文件,有的记载特定任务。在数据库中用事务日志文件记录数据的修改操作,其中的

系统 2019-09-27 17:55:34 2199

Python

Python 爬虫“学前班”!学会免踩坑!

作者|喵叔责编|胡巍巍出品|CSDN(ID:CSDNnews)爬虫应用的广泛,例如搜索引擎、采集数据、广告过滤、数据分析等。当我们对少数网站内容进行爬取时写多个爬虫还是有可能的,但是对于需要爬取多个网站内容的项目来说是不可能编写多个爬虫的,这个时候我们就需要智能爬虫。智能爬虫目前有三种:1.基于网页内容的爬虫当网页含有大量需要提取的信息时,我们就需要用到基于网页内容的爬虫。该爬虫会将HTML视为文本并利用NLP技术进行处理。虽然说这种基于网页内容的爬虫可以

系统 2019-09-27 17:55:06 2199

Python

Python中的is和==比较两个对象的两种方法

Python中的is和==比较两个对象的两种方法在Python中有两种方式比较两个对象是否相等,分别是is和==,两者之间是不同的==比较的是值(如同java中的equals方法)is比较的是引用(可以看作比较内存地址,类似于java中的==)对于:>>>n=1>>>nis1True>>>b='1'>>>bis1False>>>n==bFalse由于1和'1'不管在值上面还是在引用上面都不同,所以结果都为false对于:>>>n=1>>>nis1True这

系统 2019-09-27 17:53:48 2199

Python

Spark学习实例(Python):共享变量Shared Variables

通常在使用Spark算子函数,比如使用map()或者reduce函数我们向函数传入条件时,函数内部可以使用驱动程序中定义的变量,但是这样会使集群中所有任务都会得到变量新的副本,这些副本的更新不会传播回驱动程序,导致读写共享变量效率低下或者内存溢出,为了解决这个问题Spark提供了两种共享变量类型:广播变量和累加器广播变量:用来高效分发较大对象,只能在Driver定义,不能在Executor端定义,同时RDD不存储数据所以不能广播出去累加器:用来对信息进行聚

系统 2019-09-27 17:52:33 2199

Python

Python3.6内置函数(10)——chr()

英文文档chr(i)ReturnthestringrepresentingacharacterwhoseUnicodecodepointistheintegeri.Forexample,chr(97)returnsthestring‘a’,whilechr(8364)returnsthestring‘€’.Thisistheinverseoford().Thevalidrangefortheargumentisfrom0through1,114,111(0

系统 2019-09-27 17:52:30 2199

Python

Python基础之函数、方法

函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段。定义一个函数:def函数名(参数列表):函数体#定义一个没有参数,没有函数体实现的函数;pass相当于占位符,使定义函数满足语法要求,或者是先定义一个函数名,后面再实现其功能deffunc():pass#定义一个add函数,参数为a,b,返回a+b的结果:defadd(a,b):returna+bprint(add(1,2))3return函数最终返回的内容,如果没有写return,则默认返

系统 2019-09-27 17:50:30 2199

Python

Python字典操作简明总结

1.dict()创建字典复制代码代码如下:>>>fdict=dict((['x',1],['y',2]))>>>fdict{'y':2,'x':1}2.fromkeys()来创建一个"默认"字典,字典中元素具有相同的值复制代码代码如下:>>>ddict={}.fromkeys(('x','y'),-1)>>>ddict{'y':-1,'x':-1}3.遍历字典使用keys()遍历复制代码代码如下:>>>dict2={'name':'earth','port

系统 2019-09-27 17:50:06 2199