搜索到与相关的文章
Python

零基础写python爬虫之神器正则表达式

接下来准备用糗百做一个爬虫的小例子。但是在这之前,先详细的整理一下Python中的正则表达式的相关内容。正则表达式在Python爬虫中的作用就像是老师点名时用的花名册一样,是必不可少的神兵利器。一、正则表达式基础1.1.概念介绍正则表达式是用于处理字符串的强大工具,它并不是Python的一部分。其他编程语言中也有正则表达式的概念,区别只在于不同的编程语言实现支持的语法数量不同。它拥有自己独特的语法以及一个独立的处理引擎,在提供了正则表达式的语言里,正则表达

系统 2019-09-27 17:54:47 2144

Python

Python 学习 第15篇:日期和时间

datetime模块中包含五种基本类型:date、time、datetime、timedelta和tzinfo,tz是timezone的缩写,tzinfo用于表示时区信息。一,date类型date类型表示日期,是由year、month和day构成的对象1,初始化date对象使用date(year,month,day)函数来初始化date对象:fromdatetimeimportdatemydate=date(year,month,day)2,date对象函

系统 2019-09-27 17:54:44 2144

Python

Python读写文件模式和文件对象方法实例详解

本文实例讲述了Python读写文件模式和文件对象方法。分享给大家供大家参考,具体如下:一.读写文件模式利用open()读写文件时,将会返回一个file对象,其基本语法格式如:open(filename,mode)其中,filename变量是一个包含了你要访问的文件名称的字符串值。而mode决定了你打开文件的模式:只读,写入,追加等。所有可取值见如下的完全列表。注:这个参数是非强制的,默认文件访问模式为只读模式(r)例如,我们现在将一个字符串写入到test.

系统 2019-09-27 17:54:20 2144

Python

python查找重复图片并删除(图片去重)

本文实例为大家分享了python查找重复图片并删除的具体代码,供大家参考,具体内容如下和网络爬虫配套的,也可单独使用,从网上爬下来的图片重复太多,代码支持识别不同尺寸大小一致的图片,并把重复的图片删除,只保留第一份。#-*-coding:utf-8-*-importcv2importnumpyasnpimportos,sys,typesdefcmpandremove2(path):dirs=os.listdir(path)dirs.sort()iflen(

系统 2019-09-27 17:51:12 2144

Python

day006-python函数

一、定义函数def函数名():函数体代码例:#定义函数defemail():print('sendemail')#调用执行函数email()二、函数的返回值defemail():print("sendemail")return"发送成功"#没有return,默认返回Noneret=email()#函数return后面是什么值,ret等于返回值print(ret)注意:一旦遇到return,函数内部return以下的代码不再执行。三、函数的普通参数defem

系统 2019-09-27 17:51:12 2144

Python

Python2使用Python3不再使用系列(持续更新)~

1.reload()函数Python2:reload()函数封装在sys模块中,使用时:importsysreload()Python3:reload()不再封装在sys模块中,而是importlib,使用方式如下:importimportlibimportyourfilereload('yourfile')注意:使用reload()函数时需要import你的文件参考文章:https://blog.csdn.net/heifan2014/article/d

系统 2019-09-27 17:50:49 2144

Python

杜凯杰教学数据分析:python 图片爬取 爬取各校校花图片

python图片爬取爬取各校校花图片—杜凯杰爬取十页校花图片(可按需求更改页数,爬取更多图片)—杜凯杰importrequestsfromlxmlimportetreestartUrl='http://www.xiaohuar.com/list-1-'headers={'User-Agent':'Mozilla/5.0(WindowsNT6.1;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/74.0

系统 2019-09-27 17:50:47 2144

Python

Linux下Python脚本自启动和定时启动的详细步骤

一、Python开机自动运行假如Python自启动脚本为auto.py。那么用root权限编辑以下文件:sudovim/etc/rc.local如果没有rc.local请看这篇文章在exit0上面编辑启动脚本的命令/usr/bin/python3/home/selfcs/auto.py>/home/selfcs/auto.log最后重启Linux,脚本就能自动运行并打印日志了。二、让Python脚本定时启动用root权限编辑以下文件sudovim/etc/

系统 2019-09-27 17:49:28 2144

Python

把英雄分类,看 Python 带你上王者

王者荣耀这么久了,还没上王者?哈哈哈,看过来,是不是对英雄理解的不够透彻呢,是不是还没有很好的为英雄分类呢,今天就来看看英雄分类技术栈一、EM聚类简介二、爬取网上的英雄初始属性值三、做成饼图EM聚类简介EM英文名是ExpectationMaximization,也叫最大期望算法。在统计计算中,最大期望(EM)算法是在概率(probabilistic)模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐藏变量(LatentVari

系统 2019-09-27 17:48:38 2144

Python

Python中字典(dict)和列表(list)的排序方法实例

一、对列表(list)进行排序推荐的排序方式是使用内建的sort()方法,速度最快而且属于稳定排序复制代码代码如下:>>>a=[1,9,3,7,2,0,5]>>>a.sort()>>>printa[0,1,2,3,5,7,9]>>>a.sort(reverse=True)>>>printa[9,7,5,3,2,1,0]>>>b=['e','a','be','ad','dab','dbc']>>>b.sort()>>>printb['a','ad','be'

系统 2019-09-27 17:48:22 2144