搜索到与相关的文章
Python

第一个python爬虫,爬取猫眼电影Top100榜

学习python以来的第一爬虫,参考《Python3网络爬虫开发实践》爬取目标为:猫眼电影Top100榜完全是依葫芦画瓢,首先请求网页内容,然后在通过正则表达式提取自己感兴趣的数据,最后转成json格式存入文本文件。importjsonimporttimeimportrequestsimportredefget_one_page(url):headers={'User-agent':'Mozilla/5.0(Macintosh;IntelMacOSX10_

系统 2019-09-27 17:50:24 3145

Java

Java 建立mysql数据库连接的语句

每次在面试时被问到jdbc的数据路链接过程都卡着,这次不怕了,背会了。。。第一个,比较粗糙的try{Class.forName("com.mysql.jdbc.Driver");}catch(ClassNotFoundExceptione){}//定义所要用到的三个数据库应用对象Connectioncon=null;//连接对象Statementsql=null;//Statement对象(SQL语句)ResultSetrs=null;//结果集对象//进

系统 2019-08-12 01:52:07 3145

SqlServer

SQL Server 在多个数据库中创建同一个存储过程

原文:SQLServer在多个数据库中创建同一个存储过程(CreateSameStoredProcedureinAllDatabases)一.本文所涉及的内容(Contents)本文所涉及的内容(Contents)背景(Contexts)遇到的问题(Problems)实现代码(SQLCodes)方法一:拼接SQL;方法二:调用模板存储过程创建存储过程;总结扩展阅读参考文献(References)二.背景(Contexts)在我的数据库服务器上,同一个实例下

系统 2019-08-12 01:32:09 3145

Hadoop

Hadoop 编写WordCount

本文发表于本人博客。前面几次讲了关于Hadoop的环境搭建、HDFS操作,今天接着继续。本来Hadoop源码中就有一个例子WordCount,但是今天我们来自己实现一个加深对这个Mapper、Reducer的理解,如有不对欢迎指正。我们先来梳理一下思路,对于自定义Mapper以及Reducer,我们先要覆盖其map以及reduce函数,然后按照相关步骤比如设置输入文件目录、输入文件格式化类、设置自定义Mapper、分区、排序、分组、规约、设置自定义Redu

系统 2019-08-12 09:27:04 3144

redis

Redis slowlog

和mongo的slowlog一样,redis中对于操作时间较长(默认为10秒)的命令也会记录下来,不过它将它们保存在redisServer结构中的slowlog这个链表中,新进来的log排在链表头部,这个链表的长度可以配置,超过长度(默认为128)则将链表尾部元素踢掉。链表中的元素是slowlogEntry://Thisstructuredefinesanentryinsidetheslowloglist.typedefstructslowlogEntry

系统 2019-08-12 01:52:07 3144

数据库相关

构建访问AWS的本地命令行环境

并不是所有的EC2的功能,都可以通过基于web的AWSManagementConsole来操作,所以在本地配置一个访问EC2的命令行环境还是很重要的,特别是需要直接在EC2上去构筑服务器环境的时候。AWS一共有三种访问证书,用于不同的目的,命令行环境下需要用到其中两种:Accesskeys:用于基于REST和Query协议的请求X.509certificates:用于基于SOAP协议请求Keypairs:访问EC2实例和保护CloudFront中的内容。搭

系统 2019-08-12 01:33:22 3144

Ubuntu

Ubuntu常用软件安装

要想正真正用Linux工作,可不是安装完或者美化汉化好就可以的,常用软件可是一个都不能少阿,让我们从安装不得不装的软件开始,沿着影音播放软件、图像浏览和处理软件、网络软件、办公软件、游戏、系统工具软件、编程软件的顺序,一一道来吧。(1)不得不装的软件所谓“不得不装的软件”包括解压软件,比如常用的Winrar,词霸、快译、QQ、bt客户端、电骡、当然我们安装的是linux版本的,或者说是完全免费的。1、安装电骡别说你没有听说过这头骡子,否则你就真要好好跟上形

系统 2019-08-12 01:33:07 3144

Hive

hive优化之------控制hive任务中的map数和reduc

一、控制hive任务中的map数:1.通常情况下,作业会通过input的目录产生一个或者多个map任务。主要的决定因素有:input的文件总个数,input的文件大小,集群设置的文件块大小(目前为128M,可在hive中通过setdfs.block.size;命令查看到,该参数不能自定义修改);2.举例:a)假设input目录下有1个文件a,大小为780M,那么hadoop会将该文件a分隔成7个块(6个128m的块和1个12m的块),从而产生7个map数b

系统 2019-08-12 09:27:24 3143

数据库相关

HDU 4873 ZCC Loves Intersection(可能性)

HDU4873ZCCLovesIntersection

pid=4873"style="">题目链接题意:d维的。长度为n的块中,每次选d条平行于各条轴的线段,假设有两两相交则点数加1,问每次得到点数的期望是多少思路:自己推还是差一些,转篇官方题接把,感觉自己想的没想到把分子那项拆分成几个多项式的和,然后能够转化为公式求解。Multi-UniversityTrainingContest2--by镇海中学

系统 2019-08-12 01:54:05 3143