目的:在百度贴吧输入关键字和要查找的起始结束页,获取帖子里面楼主所发的图片思路:获取分页里面的帖子链接列表获取帖子里面楼主所发的图片链接列表保存图片到本地注意事项:问题:在谷歌浏览器使用xpathhelper插件时有匹配结果,但在程序里面使用python内带的xpath匹配却为空的原因。原因:不同服务器会对不同的浏览器返回不同的数据,导致在谷歌浏览器看到的和服务器返回的有区别解决方法:使用IE浏览器的User-agenet,而且越老的版本,报错几率相对越小
系统 2019-09-27 17:57:03 2005
前言在K近邻的原始算法中,没有对K近邻的方法进行优化,还是遍历训练集,找到与输入实例最近的K个训练实例,统计他们的类别,以此作为输入实例类别的判断。具体的模型理论见:统计学习方法——K近邻法(原始方法)1.K近邻算法的实现在算法实现的过程中,利用的是欧氏距离进行点与点之间的距离度量。在进行数据运算的时候,没有利用numpy,而是利用Python中自带的list来进行数据的计算。defknn(x,dataSet,labels,k):distanceMemor
系统 2019-09-27 17:56:59 2005
OS模块的常见用法os.remove()删除文件os.rename()重命名文件os.walk()生成目录树下的所有文件名os.chdir()改变目录os.mkdir/mkdirs创建目录/多层目录os.rmdir/removedirs删除目录/多层目录os.listdir()列出指定目录的文件os.getcwd()取得当前工作目录os.chmod()改变目录权限os.path.basename()去掉目录路径,返回文件名os.path.dirname()
系统 2019-09-27 17:56:42 2005
画矩形函数调用:cv2.rectangle(img,pt1,pt2,color,thickness,line_type,shift)img:图像.pt1:矩形的一个顶点。pt2:矩形对角线上的另一个顶点color:线条颜色(RGB)或亮度(灰度图像)(grayscaleimage)。thickness:组成矩形的线条的粗细程度。取负值时(如CV_FILLED)函数绘制填充了色彩的矩形。line_type:线条的类型。见cvLine的描述shift:坐标点的
系统 2019-09-27 17:56:28 2005
使用Python写CUDA程序有两种方式:*Numba*PyCUDAnumbapro现在已经不推荐使用了,功能被拆分并分别被集成到accelerate和Numba了。例子numbaNumba通过及时编译机制(JIT)优化Python代码,Numba可以针对本机的硬件环境进行优化,同时支持CPU和GPU的优化,并且可以和Numpy集成,使Python代码可以在GPU上运行,只需在函数上方加上相关的指令标记,如下所示:importnumpyasnpfromti
系统 2019-09-27 17:56:19 2005
python内置函数有两种,一种是python实现的,一种是C语言实现的。python实现的–1.直接在IDE里面按住ctrl追踪到源码。–2.使用help内置函数,例如:help(os)C语言实现的不能直接在IDE里面查看比如builtins.py里的zip,需要去Cpython源码中查看:https://github.com/python/cpython/blob/master/Python/bltinmodule.ctypedefstruct{PyO
系统 2019-09-27 17:56:18 2005
python获取指定时间差的时间实例详解在分析数据的时间经常需要截取一定范围时间的数据,比如三天之内,两小时前等等时间要求的数据,因此将该部分经常需要用到的功能模块化,方便以后以后用到的时候复用。在此,也分享给大家。importtimeimportsysreload(sys)defget_day_of_day(UTC=False,days=0,hours=0,miutes=0,seconds=0):'''''''ifdays>=0,dateislarger
系统 2019-09-27 17:56:08 2005
Python2默认是不支持中文的,一般我们在程序的开头加上#-*-coding:utf-8-*-来解决这个问题,但是在我用open()方法打开文件时,中文名字却显示成了乱码。我先给大家说说Python中的编码问题,Python中的字符串的大概分为为str和Unicode两种形式,其中str常用的编码类型为utf-8,gb2312,gbk等等,Python使用Unicode作为编码的基础类型。str记录的是字节数组,只是某种编码的存储格式,终于输出到文件或是
系统 2019-09-27 17:56:07 2005
一、数据类型:-数值-字符串-列表-元组-字典1.数值类型:(1)整型In[6]:a=123In[7]:type(a)Out[7]:intIn[8]:(2)长整型In[8]:a=199999999999999999999999999999In[9]:aOut[10]:199999999999999999999999999999LIn[11]:type(a)Out[12]:longIn[13]:(3)浮点型0.0,12.0-18.83e+7等科学计数法是浮点
系统 2019-09-27 17:56:05 2005
每一幅图像都包含某种程度的噪声,噪声可以理解为由一种或者多种原因造成的灰度值的随机变化,如由光子通量的随机性造成的噪声等,在大多数情况下,通过平滑技术(也常称为滤波技术)进行移植或者去除,其中具备保持边缘作用的平滑技术得到了更多的关注。常用的平滑处理算法包括基于二维离散卷积的高斯平滑、均值平滑,基于统计学方法的中值平滑,具备保持边缘作用的平滑算法的双边滤波。1.卷积定义及矩阵形式(1)full卷积(2)valid卷积(3)same卷积(4)Python实现
系统 2019-09-27 17:55:48 2005