搜索到与相关的文章
各行各业

[Nutch]如何利用HTML页面中meta元素?

[Nutch]如何利用HTML页面中meta元素?[郑昀]1:假如说你的站点页面中有这么一句:你利用Nutch抓取并分析时,如何得到这个meta数值并处理呢?2:你可以从HtmlParseFilter扩展出一个RobotsParserFilter,用下面的代码得到meta值:PropertiesgeneralMetaTags=metaTags.getGeneralTags()

系统 2019-08-12 01:32:23 2280

各行各业

Yaha,Yaho

Yaha:Yaho:听雪楼上听雪落,雪落无声空余楼。同样的地方,一坐三年多,人走楼空,回顾空留。自己非常白痴地画着苹果,非常嗨森地逗自己玩。这两层精致的书库是大学里面能容纳我的地方(ABC的机房,截拳道的武馆也算)。就像高中最后一年,自己一个待在一栋没人去的教学楼里,预习,复习。那时候真希望能有鬼出来陪自己聊聊废话,尤其是到晚上的时候。只是非常庆幸的是,那时候有个女孩子天天晚上给我泡一杯绿茶,泡完茶送到那栋阴暗的楼里面,就离开。非常久曾经的事情了。近期小煜

系统 2019-08-12 01:31:46 2280

Python

真正搞明白Python中Django和Flask框架的区别

在谈Python中Django框架和Flask框架的区别之前,我们需要先探讨如下几个问题。一、为什么要使用框架?为了更好地阐述这个问题,我们把开发一个应用的过程进行类比,往往开发一个应用(web应用、系统应用)跟建造房子的过程一样,需要先打地基,搭好骨架,然后一块砖一块砖叠上去。而开发一个应用呢?同样也需要一个好的架构设计,数据库建模,然后一个模块一个模块使用代码实现。如果开发一个软件应用不使用框架,和我们建房子时,每一块砖、每一根钢筋都需要自己生产出来本

系统 2019-09-27 17:56:18 2279

Python

python中pycurl库的用法实例

本文实例讲述了python中pycurl库的用法,分享给大家供大家参考。该实例代码实现从指定网址读取网页,主要是pycurl库的使用。具体实现方法如下:#定义一个类classCallBack:"""forpycurl"""def__init__(self):"""Constructor"""self.data=""deffunc(self,data):self.data=self.data+datadefurls(md5,location="",optio

系统 2019-09-27 17:55:51 2279

Python

详解Python下载图片并保存本地的两种方式

一:使用Python中的urllib类中的urlretrieve()函数,直接从网上下载资源到本地,具体代码:importos,statimporturllib.requestimg_url="https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1516371301&di=d99af0828bb301fea27c2149a7070"\"d44&imgtype=jpg&er=

系统 2019-09-27 17:55:44 2279

Python

python 环境变量和import模块导入方法(详解)

1、定义模块:本质就是.py结尾的文件(逻辑上组织python代码)模块的本质就是实现一个功能文件名就是模块名称包:一个有__init__.py的文件夹;用来存放模块文件2、导入模块import模块名form模块名import*from模块名import模块名as新名称3、导入模块本质import模块名===》将模块中所有的数据赋值给模块名,调用时需要模块名.方法名()from模块名import方法名==》将该方法单独放到当前文件运行一遍,调用时只需要方法

系统 2019-09-27 17:54:33 2279

Python

Python实现检测服务器是否可以ping通的2种方法

好想在2014结束前再赶出个10篇博文来,~(>_<)~,不写博客真不是一个好兆头,至少说明对学习的欲望和对知识的研究都不是那么积极了,如果说这1天的时间我能赶出几篇精致的博文,你们信不信,哈哈,反正我是信了。。。python检测服务器是否ping通的2种方法1、第一种比较挫,就是用ping,python调用shell,这个适用于较少的服务器数量,几百台已经很慢了(当然是说python同步的方法,要是nodejs异步方式还是很快的,但是nodejsCPU计

系统 2019-09-27 17:53:22 2279

Python

Python用GET方法上传文件

之前在osc看到一个文章讨论Get和Post的不同,有人说不能用Get来上传文件。这就是用Get上传文件的例子,client用来发Get请求,server用来收请求。文件内容是在http请求的body内传过去的。用了不同的语言,因为我觉得各自处理起来都要方便些。而且我觉得浏览器也是可以发出这样的请求的,之后我会尝试一下。请求端代码复制代码代码如下:importrequests#需要安装requestswithopen('test.txt','rb')asf

系统 2019-09-27 17:51:34 2279

Python

工作中常用到的python数据处理

目录1.获取工作目录和设置工作目录2.获取日期处理3.列表的倒排序4.使用apply处理两个值的代码5.断言函数assert6.yield生成器7.获取程序运行时间8.动态生成变量9.数据可持续化操作10.数据运行时间211.创建目录12.删除无用的数据13.字符串格式化14.zip自动生成字典15.各种包的离线下载地址16.路径的设置17.数据添加ignore_index的使用技巧18.删除nan的总结19.批量重命名20.nohup的使用21.rese

系统 2019-09-27 17:49:55 2279

Python

基于Python的Appium环境搭建合集

自动化一直是测试圈中的热聊,也是大家追求的技术方向。在测试中,往往回归测试也是测试人员的“痛点”。对于迭代慢、变更少的功能,就能用上自动化来替代人工回归,减轻工作量。问题在分享环境搭建之前,先抛出我的一个疑问吧。app启用时,分不同的场景:1.首次安装启用,有欢迎页;2.非首次启用,直接进入到登录页;3.配置了推荐展示时,启用app,会先展示推荐内容,才进入到登录页。不同场景对应的activity都是不同的,我目前处理办法是,写了个输入函数,加了个if判断

系统 2019-09-27 17:49:53 2279