搜索到与相关的文章
各行各业

nutch 存储到数据库

就像我们知道的一样,nutch是一个架构在lucene之上的网络爬虫+搜索引擎.是由lucene的作者在lucene基础之上开发,并整合了hadoop,实现在分布式云计算,使用google标准的HFDS文件系统作为存储结构,是一款高伸缩性能与高效高并发的网络爬虫+搜索引擎.FaceYe在后台已经整合了nutch,在适当的时候,就可以开始为用户提供高质量的知识索引服务.顺便说一下,nutch在生产环境中,并不能在windows下运行,需要在liux下运行,这

系统 2019-08-12 09:27:33 2161

各行各业

keystone源码分析(一)——Paste Deploy的应用

本keystone源码分析系列基于Juno版Keystone,于2014年10月16日随Juno版OpenStack发布。Keystone作为OpenStack中的身份管理与授权模块,主要实现系统用户的身份认证、基于角色的授权管理、其他OpenStack服务的地址发现和安全策略管理等功能。Keystone作为开源云系统OpenStack中至关重要的组成部分,与OpenStack中几乎所有的其他服务(如Nova,Glance,Neutron等)都有着密切的联

系统 2019-08-12 09:27:21 2161

Python

selenium+python find_element_by_css_selector

在一个页面中有多个checkbox并且id是不同的,要一次性选择所有的checkboxcheckboxes=dr.find_elements_by_css_selector('input[type=checkbox]')forcheckboxincheckboxes:checkbox.click()time.sleep(10)引用:http://www.cnblogs.com/paisen/p/3310395.htmlhttp://www.cnblogs.

系统 2019-08-12 09:27:05 2161

编程技术

统计学习方法(四)——朴素贝叶斯法

/*先把标题给写了、这样就能经常提醒自己*/题记:今天下午去上厕所的一会儿时间,就把第四章给扫完了,说是扫完了主要是因为没有深入去看,对于某些证明都直接跳过了,看了一下里面的例子,大概懂个意思就行了1.朴素贝叶斯法设输入空间为维向量的集合,输出空间为类标记集合,输入特征向量,输出类标记为,是和的联合概率分布,数据集由独立同分布产生。朴素贝叶斯法就是通过训练集来学习联合概率分布.具体怎么学习呢?主要就是从先验概率分布和条件概率分布入手,俩个概率相乘即可得联合

系统 2019-08-12 01:32:12 2161

Python

Python学习笔记之读取文件、OS模块、异常处理、with as语法示例

本文实例讲述了Python学习笔记之读取文件、OS模块、异常处理、withas语法。分享给大家供大家参考,具体如下:文件读取#读取文件f=open("test.txt","r")print(f.read())#打印文件内容#关闭文件f.close()获取文件绝对路径:OS模块os.environ["xxx"]获取系统环境变量os.getcwd获取当前python脚本工作路径os.getpid()获取当前进程IDos.getppid()获取父进程ID异常#读

系统 2019-09-27 17:57:26 2160

Python

Python pip 使用国内镜像

##推荐源```https://mirrors.aliyun.com/pypi/simple/阿里镜像,速度快、稳定https://pypi.douban.com/simple/豆瓣镜像```##使用方法###1.使用时修改```pipinstall-i[国内镜像地址][模块名称]```###2.修改配置文件修改或创建`~/.pip/pip.conf`文件内容:```[global]index-url=https://mirrors.aliyun.com/

系统 2019-09-27 17:57:07 2160

Python

python django 访问静态文件出现404或500错误

djangostatic文件夹下面的内容方法不了出现404500错误需要查看自己的settings文件确保有一下内容importosPROJECT_ROOT=os.path.dirname(__file__)DEBUG=TrueSTATIC_URL='/static/'STATICFILES_DIRS=(os.path.join(PROJECT_ROOT,'static'),)STATICFILES_FINDERS=('django.contrib.sta

系统 2019-09-27 17:56:54 2160

Python

python 文件处理

文件概述​若想将应用程序获取到的数据永久保存下来,就必须保存于硬盘中,操作系统把复杂的硬件操作封装成简单的接口给用户/应用程序使用,其中文件就是操作系统提供给应用程序来操作硬盘虚拟概念,用户或应用程序通过操作文件,可以将自己的数据永久保存下来。文剑操作流程打开一个文件,得到一个文件句柄并复制给变量fp=open('a.txt',mode='r',encoding='utf-8')通过文件句柄对文件进行操作data=fp.read()关闭文件fp.colse

系统 2019-09-27 17:56:38 2160

Python

python 修改本地网络配置的方法

本文主要说一下怎么使用Python来修改本地的ip和dns等,因为有本地的ip和dns都是随机获取的,有些时候不是很方便,需要修改,我就稍微的封装了一下,但是随机ip和网关、子网掩码等我都没有设置为参数,因为经常用也懒得改了,可以自己去修改一下。测试的时候,在win8.1上面需要用管理员身份才能执行,win7似乎是不需要管理员身份的。使用的Python库是WMI,这个是默认安装了的。如果没有去网上下载即可。该说的都在注释里,就直接上代码了。#-*-codi

系统 2019-09-27 17:56:25 2160

Python

浅谈Python生成器generator之next和send的运行流程(详解)

对于普通的生成器,第一个next调用,相当于启动生成器,会从生成器函数的第一行代码开始执行,直到第一次执行完yield语句(第4行)后,跳出生成器函数。然后第二个next调用,进入生成器函数后,从yield语句的下一句语句(第5行)开始执行,然后重新运行到yield语句,执行后,跳出生成器函数,后面再次调用next,依次类推。下面是一个列子:defconsumer():r='here'foriinxrange(3):yieldrr='200OK'+str(

系统 2019-09-27 17:55:41 2160