拥有Hadoop标签的文章
Hadoop

Ganglia监控Hadoop集群的安装部署

一、安装环境Ubuntuserver12.04安装gmetad的机器:192.168.52.105安装gmond的机器:192.168.52.31,192.168.52.32,192.168.52.33,192.168.52.34,192.168.52.35,192.168.52.36,192.168.52.37,192.168.52.38,192.168.52.105浏览监控web页面的机器:192.168.52.105二、介绍Ganglia监控套件包括

系统 2019-08-12 09:27:06 2566

Hadoop

hadoop经典系列(六)2.x的mapreduce过程图解

从业界使用分布式系统的变化趋势和hadoop框架的长远发展来看,MapReduce的JobTracker/TaskTracker机制需要大规模的调整来修复它在可扩展性,内存消耗,线程模型,可靠性和性能上的缺陷。在过去的几年中,hadoop开发团队做了一些bug的修复,但是最近这些修复的成本越来越高,这表明对原框架做出改变的难度越来越大。为从根本上解决旧MapReduce框架的性能瓶颈,促进Hadoop框架的更长远发展,从0.23.0版本开始,Hadoop的

系统 2019-08-12 09:30:06 2562

Hadoop

Hadoop 编写WordCount

本文发表于本人博客。前面几次讲了关于Hadoop的环境搭建、HDFS操作,今天接着继续。本来Hadoop源码中就有一个例子WordCount,但是今天我们来自己实现一个加深对这个Mapper、Reducer的理解,如有不对欢迎指正。我们先来梳理一下思路,对于自定义Mapper以及Reducer,我们先要覆盖其map以及reduce函数,然后按照相关步骤比如设置输入文件目录、输入文件格式化类、设置自定义Mapper、分区、排序、分组、规约、设置自定义Redu

系统 2019-08-12 09:27:04 2512

Hadoop

WordCount&Hadoop

第一个Hadoop下的Wordcount程序这次的源码是用的Hadoop实战的源码首先将源码拷贝进Linux下的工作目录下,在/home/hadoop/workspace下。导入两个测试文件echo"HelloWorldByeWorld"file01echo"HelloHadoopByeHadoop"file02创建一个Jar包目录:mkdirFirstJar编译Java文件至FirstJar下:javac-classpath/usr/hadoop/had

系统 2019-08-12 09:27:20 2488

Hadoop

hadoop2.2.0目录结构

一.hadoop2.0的目录结构如下图所示二.bin目录Hadoop最基本的管理脚本和使用脚本所在目录,这些脚本是sbin目录下管理脚本的基础实现,用户可以用这些脚本管理和使用hadoop三.etc目录hadoop配置文件所在的目录,包括core-site.xml、hdfs-site.xml、mapred-site.xml等从hadoop1.0继承而来的配置文件和yarn-site.xml等hadoop2.0新增的文件。.template是模板文件四.in

系统 2019-08-12 09:30:36 2473