Hadoop - 军军小站|张军博客

个人简介

java-web项目加密运行（支持window/linux）

网址导航

JAVA项目加密(Windows/Linux/Mac/龙芯系统)

视频讲解-Java调用DLL

eclipse安装hadoop插件

在eclipse中配置hadoop插件1.安装插件准备程序：eclipse-3.3.2（这个版本的插件只能用这个版本的eclipse）hadoop-0.20.2-eclipse-plugin.jar（在hadoop-0.20.2/contrib/eclipse-plugin目录下）将hadoop-0.20.2-eclipse-plugin.jar复制到eclipse/plugins目录下，重启eclipse。2.打开MapReduce视图Window->O

系统 2019-08-29 23:25:34 4148

Hadoop

Hadoop之BloomFilter

BloomFilter概述：目的是检索元素是否在某个集合中，基于hash，速度比较快，不需要存储所有的元素，只需要按照某种方式存储hash值即可，因此比较节约内存，因此可以常驻内存加快查找速度。同时利用多个hash来解决hash冲突问题我们假定集合元素为一个列表，我们可以用一个bit列表来存储此元素是否存在，如下所示：存在为1不存在为0，不过由于hash很容易冲突，那么可以基于多hash函数进行冲突的避免，每次设置对于的hash值为1，如下所示：也就是说x

系统 2019-08-12 09:29:45 3932

Hadoop

Hadoop1.2.1 SecondNameNode与NameNode分离部署

环境如下(停止所有服务stop-all.sh)：master：master192.168.1.106slave：slave1192.168.1.107slave2192.168.1.1081、修改master（改为slave其中的一个）slave12、修改core-site.xmlfs.default.namehdfs://master:90003、修改hdf

系统 2019-08-12 09:29:34 3871

Hadoop

Hadoop集群上使用Lzo压缩

转自：http://www.tech126.com/hadoop-lzo/自从Hadoop集群搭建以来，我们一直使用的是Gzip进行压缩当时，我对gzip压缩过的文件和原始的log文件分别跑MapReduce测试，最终执行速度基本差不多而且Hadoop原生支持Gzip解压，所以，当时就直接采用了Gzip压缩的方式关于Lzo压缩，twitter有一篇文章，介绍的比较详细，见这里：Lzo压缩相比Gzip压缩，有如下特点：压缩解压的速度很快Lzo压缩是基于Blo

系统 2019-08-12 09:29:35 3711

Hadoop

CentOs6搭建Hadoop1.2.1分布式集群

系统：CentOs664位环境：1台namenode2台datanode用户名全是girdmaster192.168.1.103slave1192.168.1.104slave2192.168.1.107具体的安装步骤如下：1、下载jdk1.6以及hadoop1.2.1（去官网下载即可，都是64位）2、使用filezilla将jdk和hadoop上传至master服务器，jdk上传至slave1服务器和slave2服务器3、设置host，命令如下：vi/e

系统 2019-08-12 09:29:34 3695

Hadoop

hadoop2.5.2学习及实践笔记（四）—— namenode

对namenode启动时的相关操作及相关类有一个大体了解，后续深入研究时，再对本文进行补充>实现类HDFS启动脚本为$HADOOP_HOME/sbin/start-dfs.sh，查看start-dfs.sh可以看出，namenode是通过bin/hdfs命令来启动$vistart-dfs.sh#namenodesNAMENODES=$($HADOOP_PREFIX/bin/hdfsgetconf-namenodes)echo"Startingnamenod

系统 2019-08-12 09:27:18 3669

Hadoop

hadoop权限管理

1.介绍本文介绍的Hadoop权限管理包括以下几个模块：（1）用户分组管理。用于按组为单位组织管理，某个用户只能向固定分组中提交作业，只能使用固定分组中配置的资源；同时可以限制每个用户提交的作业数，使用的资源量等（2）作业管理。包括作业提交权限控制，作业运行状态查看权限控制等。如：可限定可提交作业的用户；可限定可查看作业运行状态的用户；可限定普通用户只能修改自己作业的优先级，kill自己的作业；高级用户可以控制所有作业等。想要支持权限管理需使用FairSc

系统 2019-08-29 21:58:39 3615

Hadoop

Hadoop HDFS分布式文件系统设计要点与架构

Hadoop简介：一个分布式系统基础架构，由Apache基金会开发。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统（HadoopDistributedFileSystem），简称HDFS。HDFS有着高容错性的特点，并且设计用来部署在低廉的（low-cost）硬件上。而且它提供高传输率（highthroughput）来访问应用程序的数据，适合那些有着超大数据集（largedat

系统 2019-08-12 09:27:11 3611

Hadoop

Install RHadoop with Hadoop 2.2 – Red Hat L

PrerequisiteHadoop2.2hasbeeninstalled(andthebelowinstallationstepsshouldbeappliedoneachofHadoopnode)Step1.InstallR(byyum)[hadoop@c0046220yum.repos.d]$sudoyumupdate[hadoop@c0046220yum.repos.d]$yumsearchr-project[hadoop@c0046220yum.

系统 2019-08-12 09:26:49 3609

Hadoop

Hadoop 的 TotalOrderPartitioner

http://blog.oddfoo.net/2011/04/17/mapreduce-partition%E5%88%86%E6%9E%90-2/Partition所处的位置Partition位置Partition主要作用就是将map的结果发送到相应的reduce。这就对partition有两个要求：1）均衡负载，尽量的将工作均匀的分配给不同的reduce。2）效率，分配速度一定要快。Mapreduce提供的PartitionerMapreduce默认的

系统 2019-08-12 09:29:57 3580

Hadoop

Hadoop 集群傻瓜式搭建手记

关于Hadoop的配置，按照我的理解，应该有六个文件需要修改，它们都在Hadoop的conf文件夹下，分别是：masters/slavers：配置masters和slavers的机器IPhadoop-env.sh：Hadoop运行时的环境变量，比如JAVA_HOME，LOG之类的core-site.xml：Hadoop的核心配置文件，对应并覆盖core-default.xml中的配置项hdfs-site.xml：HDFS的配置文件，对应并覆盖hdfs-de

系统 2019-08-29 23:51:04 3558

Hadoop

《openstack 和hadoop的区别是什么？》

openstack和hadoop的区别是什么？（一）openstack仿照的Amazon的云，hadoop仿照的是Google的云openstack注重的是虚拟化/虚拟机及其配套的服务，hadoop注重的是海量的数据分析和处理。（二）2OpenStack主要目的是做一整套的云计算基础构架。包括云计算(Compute),网络(Network)，对象存贮(ObjectStore)，镜像文件存储(Image)，身份认证(Authentication)，Block

系统 2019-08-12 09:27:35 3554

Hadoop

hadoop namenode多次格式化后，导致datanode启

jpshadoopnamenode-formatdfsdirectory:/home/hadoop/dfs--data--current/VERSION#WedJul3020:41:03CST2014storageID=DS-ab96ad90-7352-4cd5-a0de-7308c8a358ffclusterID=CID-aa2d4761-974b-4451-8858-bbbcf82e1fd4cTime=0datanodeUuid=a3356a09-78

系统 2019-08-12 09:27:32 3554

Hadoop

解析Hadoop新一代MapReduce框架Yarn

更快、更强——解析Hadoop新一代MapReduce框架Yarn摘要：本文介绍了Hadoop自0.23.0版本后新的MapReduce框架（Yarn)原理、优势、运作机制和配置方法等；着重介绍新的Yarn框架相对于原框架的差异及改进。编者按：对于业界的大数据存储及分布式处理系统来说，Hadoop是耳熟能详的卓越开源分布式文件存储及处理框架，对于Hadoop框架的介绍在此不再累述，随着需求的发展，Yarn框架浮出水面，@依然光荣复兴的博客给我们做了很详细的

系统 2019-08-29 22:57:31 3533

Hadoop

hadoop伪分布式搭建

转载http://xuyuanshuaaa.iteye.com/blog/10633031.SSH无密码验证配置Hadoop需要使用SSH协议，namenode将使用SSH协议启动namenode和datanode进程，伪分布式模式数据节点和名称节点均是本身，必须配置SSHlocalhost无密码验证。执行ssh-keygen-trsa通过以上命令将在/root/.ssh/目录下生成id_rsa私钥和id_rsa.pub公钥。进入/root/.ssh目录在

系统 2019-08-29 22:08:33 3516

首页
上一页
1
2
3
4
下一页
末页
共 4页,共50条

热门排行