目的:爬取阳光热线问政平台问题反映每个帖子里面的标题、内容、编号和帖子urlCrawlSpider版流程如下:创建爬虫项目dongguangscrapystartprojectdongguang设置items.py文件#-*-coding:utf-8-*-importscrapyclassNewdongguanItem(scrapy.Item):#definethefieldsforyouritemherelike:#name=scrapy.Field()
系统 2019-09-27 17:57:06 2082
创建目录python3.6.5安装目录:mkdir/usr/local/python3.6.5进入安装目录:cd/usr/local/python3.6.5执行以下命令,下载python安装包wgethttps://www.python.org/ftp/python/3.6.5/Python-3.6.5.tgz解压安装包tar-xzvfPython-3.6.5.tgz执行以下命令切换到解压目录:cdPython-3.6.5执行以下命令,安装gcc组件yum
系统 2019-09-27 17:55:38 2082
前言随着人工智能的日益火热,计算机视觉领域发展迅速,尤其在人脸识别或物体检测方向更为广泛,今天就为大家带来最基础的人脸识别基础,从一个个函数开始走进这个奥妙的世界。首先看一下本实验需要的数据集,为了简便我们只进行两个人的识别,选取了beyond乐队的主唱黄家驹和贝斯手黄家强,这哥俩长得有几分神似,这也是对人脸识别的一个考验:两个文件夹,一个为训练数据集,一个为测试数据集,训练数据集中有两个文件夹0和1,之前看一些资料有说这里要遵循“slabel”命名规则,
系统 2019-09-27 17:55:02 2082
本文实例讲述了python列表,字典,元组简单用法。分享给大家供大家参考,具体如下:列表#_*_coding:utf-8_*_#列表,定义在方括号的形式中,可以进行切片操作。#它没有固定类型的约束,即可以包含不同的数据类型。L=[1,'abc',2.3]printlen(L)print'*'*40L.append('mengtianwxs')print(L)print'*'*40L.pop(0)print(L)print'*'*40L.sort()prin
系统 2019-09-27 17:54:55 2082
一、多线程同步由于CPython的python解释器在单线程模式下执行,所以导致python的多线程在很多的时候并不能很好地发挥多核cpu的资源。大部分情况都推荐使用多进程。python的多线程的同步与其他语言基本相同,主要包含:Lock&RLock:用来确保多线程多共享资源的访问。Semaphore:用来确保一定资源多线程访问时的上限,例如资源池。Event:是最简单的线程间通信的方式,一个线程可以发送信号,其他的线程接收到信号后执行操作。二、实例1)L
系统 2019-09-27 17:54:05 2082
zip文件是我们经常使用的打包格式之一,python解压和压缩zip效率非凡。python解压zip文档:复制代码代码如下:#/usr/bin/python#coding=utf-8importos,sys,timeimportzipfilefilename='callofdutyblackopszombies_1349649132343_my.zip'#要解压的文件filedir='data/'#解压后放入的目录r=zipfile.is_zipfile(
系统 2019-09-27 17:52:13 2082
做cnn的难免要做大量的图片处理。由于接手项目时间不长,且是新项目,前段时间写代码都很赶,现在稍微总结(恩,总结是个好习惯)。1,首先安装python-Image和python-skimage、python-matplotlib。简单代码:importImageasimgimportosfrommatplotlibimportpyplotasplotfromskimageimportio,transformimportargparsedefshow_dat
系统 2019-09-27 17:51:13 2082
最近在弄flask的东西,好久没写博客的,感觉少了点什么,感觉被别人落下好多,可能渐渐的养成了写博客的习惯吧。也是自己想学的东西太多了(说白了就是基础太差了,只是knowhow,不能做到konwwhy)。不说那些毒鸡汤了,我们来说说我们今天的python基础面试题吧。一,Q:python的优缺点有什么?A:优点:1,基础语法简单易学,对于初学者来说,语法还是相对简单的,比较容易学习,网上的学习资料也很多。2,面向对象,在python里继承和封装较多,而py
系统 2019-09-27 17:50:49 2082
压缩数据创建gzip文件先看一个略麻烦的做法importStringIO,gzipcontent='Lifeisshort.Iusepython'zbuf=StringIO.StringIO()zfile=gzip.GzipFile(mode='wb',compresslevel=9,fileobj=zbuf)zfile.write(content)zfile.close()但其实有个快捷的封装,不用用到StringIO模块f=gzip.open('fil
系统 2019-09-27 17:50:34 2082
1.读取文件;2.获得想要的数据内容:日期、最低温、最高温3.绘制图形。x轴:日期;y轴:温度变化。defread_weather_file():"""读取文件,提取内容"""files=open("./weather/weather.json","r",encoding="utf-8")weather_content=files.read()#print("天气信息:",weather_content)#print(type(weather_conten
系统 2019-09-27 17:50:02 2082
蒙特卡罗方法是一种统计模拟方法,由冯・诺依曼和乌拉姆提出,在大量的随机数下,根据概率估计结果,随机数据越多,获得的结果越精确。下面我们将用python实现蒙特卡罗方法。1.首先我们做一个简单的圆周率的近似计算,在这个过程中我们要用到随机数,因此需要先使用importnumpyasnp导入numpy库。2.代码实现:importnumpyasnptotal=8000000count=0foriinrange(total):x=np.random.rand()
系统 2019-09-27 17:50:01 2082
序列是Python中最基本的数据结构。序列中的每个元素都分配一个数字-它的位置,或索引,第一个索引是0,第二个索引是1,依此类推。Python有6个序列的内置类型,但最常见的是列表和元组。序列都可以进行的操作包括索引,切片,加,乘,检查成员。此外,Python已经内置确定序列的长度以及确定最大和最小的元素的方法。列表是最常用的Python数据类型,它可以作为一个方括号内的逗号分隔值出现。列表的数据项不需要具有相同的类型创建一个列表,只要把逗号分隔的不同的数
系统 2019-09-27 17:49:54 2082
findall函数:在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。注意:match和search是匹配一次findall匹配所有,match和search的区别也很大,可以自行网上查找!这里主要需要讨论的是其返回值的展现方式,即findall函数根据正则表达式的不同所返回的结果包含的不同信息!主要包含三种情况:1.当给出的正则表达式中带有多个括号时,列表的元素为多个字符串组成的tuple,tuple中字符串个数
系统 2019-09-27 17:47:25 2082
os:操作系统(operatingsystem)os模块中关于文件/目录常用的函数使用方法函数名使用方法getcwd()返回当前工作目录chdir(path)改变工作目录listdir(path=’.’)举指定目录中的文件名(’.‘表示当前目录,’…'表示上一级目录)mkdir(path)创建单层目录,如该目录已存在抛出异常makedirs(path)递归创建多层目录,如该目录已存在抛出异常,注意:'E:\a\b’和’E:\a\c’并不会冲突remove(
系统 2019-09-27 17:46:01 2082
需求背景最近为公司开发了一套邮件日报程序,邮件一般就是表格,图片,然后就是附件。附件一般都是默认写到txt文件里,但是PM希望邮件里的附件能直接用Excel这种软件打开,最开始想保存为Excel,但是一想Excel的文件体积会多出好多倍,csv文件默认也是使用Excel打开的,但是根本还是文本文件,体积小,保存也方便,于是最终决定使用csv模块来保存文件。Python写csv文件Python提供了内置模块读写csv文件,这里我只用到了写,读这里就不做介绍了
系统 2019-09-27 17:37:50 2082