搜索到与相关的文章
数据库相关

处理上百万条的数据库如何提高处理查询速度

处理上百万条的数据库如何提高处理查询速度1.对查询进行优化,应尽量避免全表扫描,首先应考虑在where及orderby涉及的列上建立索引。2.应尽量避免在where子句中对字段进行null值判断,否则将导致引擎放弃使用索引而进行全表扫描,如:selectidfromtwherenumisnull可以在num上设置默认值0,确保表中num列没有null值,然后这样查询:selectidfromtwherenum=03.应尽量避免在where子句中使用!=或<

系统 2019-08-12 01:32:29 2294

各行各业

[Nutch]如何利用HTML页面中meta元素?

[Nutch]如何利用HTML页面中meta元素?[郑昀]1:假如说你的站点页面中有这么一句:你利用Nutch抓取并分析时,如何得到这个meta数值并处理呢?2:你可以从HtmlParseFilter扩展出一个RobotsParserFilter,用下面的代码得到meta值:PropertiesgeneralMetaTags=metaTags.getGeneralTags()

系统 2019-08-12 01:32:23 2294

Python

python脚本实现分析dns日志并对受访域名排行

前段时间有个需求是要求查一段时间的dns上的域名访问次数排行(top100),没办法,只好慢慢的去解析dns日志呗,正好学习了python,拿来练练手。1.原始数据分析:首先看下原始数据文件,即dns日志内容,下面是抽取的几条有代表性的日志,2×8.2×1.2x.1×5这种中间的x是相应的数字被我抹去了。复制代码代码如下:13-08-3003:11:34,226INFO:queries:�C|1×3.2×8.2×0.2×0|config.dengluqi.

系统 2019-09-27 17:56:48 2293

Python

python快速查找算法应用实例

本文实例讲述了Python快速查找算法的应用,分享给大家供大家参考。具体实现方法如下:importrandomdefpartition(list_object,start,end):random_choice=start#random.choice(range(start,end+1))#把这里的start改成random()效率会更高些x=list_object[random_choice]i=startj=endwhileTrue:whilelist_

系统 2019-09-27 17:56:21 2293

Python

真正搞明白Python中Django和Flask框架的区别

在谈Python中Django框架和Flask框架的区别之前,我们需要先探讨如下几个问题。一、为什么要使用框架?为了更好地阐述这个问题,我们把开发一个应用的过程进行类比,往往开发一个应用(web应用、系统应用)跟建造房子的过程一样,需要先打地基,搭好骨架,然后一块砖一块砖叠上去。而开发一个应用呢?同样也需要一个好的架构设计,数据库建模,然后一个模块一个模块使用代码实现。如果开发一个软件应用不使用框架,和我们建房子时,每一块砖、每一根钢筋都需要自己生产出来本

系统 2019-09-27 17:56:18 2293

Python

利用Python数据分析解密双十一打折的套路

数据简介此次分析的数据来自于城市数据团对2016年双11天猫数据的采集和整理,原始数据为.xlsx格式包括update_time/id/title/price/店名,共5个字段,其中id为商品的唯一标识,店名为品牌名。分析工具主要使用了Python中的Pandas库进行数据处理,利用matplotlib绘制分析图表,利用bokeh进行了可视化展示。当前使用版本:Python3.6.5|Anaconda,Inc.|(default,Mar292018,13:

系统 2019-09-27 17:54:07 2293

Python

利用Psyco提升Python运行速度

Psyco是严格地在Python运行时进行操作的。也就是说,Python源代码是通过python命令编译成字节码的,所用的方式和以前完全相同(除了为调用Psyco而添加的几个import语句和函数调用)。但是当Python解释器运行应用程序时,Psyco会不时地检查,看是否能用一些专门的机器代码去替换常规的Python字节码操作。这种专门的编译和Java即时编译器所进行的操作非常类似(一般地说,至少是这样),并且是特定于体系结构的。到现在为止,Psyco只

系统 2019-09-27 17:53:26 2293

Python

简单的抓取淘宝图片的Python爬虫

写了一个抓taobao图片的爬虫,全是用if,for,while写的,比较简陋,入门作品。从网页http://mm.taobao.com/json/request_top_list.htm?type=0&page=中提取taobao模特的照片。复制代码代码如下:#-*-coding:cp936-*-importurllib2importurllibmmurl="http://mm.taobao.com/json/request_top_list.htm?t

系统 2019-09-27 17:53:25 2293

Python

Python3 循环语句(for、while、break、range等)

本章节将为大家介绍Python循环语句的使用。Python中的循环语句有for和while。Python循环语句的控制结构图如下所示:while循环Python中while语句的一般形式:while判断条件:语句同样需要注意冒号和缩进。另外,在Python中没有do..while循环。以下实例使用了while来计算1到100的总和:#!/usr/bin/envpython3n=100sum=0counter=1whilecounter<=n:sum=sum

系统 2019-09-27 17:53:15 2293

Python

Python用GET方法上传文件

之前在osc看到一个文章讨论Get和Post的不同,有人说不能用Get来上传文件。这就是用Get上传文件的例子,client用来发Get请求,server用来收请求。文件内容是在http请求的body内传过去的。用了不同的语言,因为我觉得各自处理起来都要方便些。而且我觉得浏览器也是可以发出这样的请求的,之后我会尝试一下。请求端代码复制代码代码如下:importrequests#需要安装requestswithopen('test.txt','rb')asf

系统 2019-09-27 17:51:34 2293