Hadoop - 军军小站|张军博客

个人简介

java-web项目加密运行（支持window/linux）

网址导航

JAVA项目加密(Windows/Linux/Mac/龙芯系统)

视频讲解-Java调用DLL

MongoDB: Hadoop Integerateion 1

HadoopandMongoDBUseCasesThefollowingaresomeexampledeploymentswithMongoDBandHadoop.Thegoalistoprovideahigh-leveldescriptionofhowMongoDBandHadoopcanfittogetherinatypicalBigDatastack.IneachofthefollowingexamplesMongoDBisusedasthe“ope

系统 2019-08-12 09:30:37 3515

Hadoop

hadoop 完全分布式下 datanode无法启动解决方法

问题描述：在集群模式下更改节点后，启动集群发现datanode一直启动不起来。我集群配置：有5个节点，分别为masterslave1-5。在master以hadoop用户执行：start-all.shjps查看master节点启动情况：NameNodeJobTrackerSecondaryNameNode均已经正常启动，利用master:50070，LiveNodes为0，随进入slave1：sshslave1,输入命令jps，发现只有TaskTracke

系统 2019-08-12 01:31:42 3503

Hadoop

Hadoop API 使用介绍

原文地址；http://hi.baidu.com/befree2008wl/blog/item/dcbe864f37c9423caec3ab7b.htmlHadoopAPI被分成（divideinto）如下几种主要的包（package）org.apache.hadoop.conf定义了系统参数的配置文件处理API。org.apache.hadoop.fs定义了抽象的文件系统API。org.apache.hadoop.dfsHadoop分布式文件系统（HDF

系统 2019-08-29 22:09:43 3502

Hadoop

分布式计算开源框架Hadoop入门实践（三）

分布式计算开源框架Hadoop入门实践（三）Hadoop基本流程一个图片太大了，只好分割成为两部分。根据流程图来说一下具体一个任务执行的情况。在分布式环境中客户端创建任务并提交。InputFormat做Map前的预处理，主要负责以下工作：验证输入的格式是否符合JobConfig的输入定义，这个在实现Map和构建Conf的时候就会知道，不定义可以是Writable的任意子类。将input的文件切分为逻辑上的输入InputSplit，其实这就是在上面提到的在分

系统 2019-08-29 22:08:15 3498

Hadoop

Hadoop中shuffle阶段流程分析

宏观上，Hadoop每个作业要经历两个阶段：Mapphase和reducephase。对于Mapphase，又主要包含四个子阶段：从磁盘上读数据-》执行map函数-》combine结果-》将结果写到本地磁盘上；对于reducephase，同样包含四个子阶段：从各个maptask上读相应的数据（shuffle）-》sort-》执行reduce函数-》将结果写到HDFS中。Hadoop处理流程中的两个子阶段严重降低了其性能。第一个是map阶段产生的中间结果要写

系统 2019-08-12 09:30:30 3494

Hadoop

Hadoop MultipleOutputs 结果输出到多个文件夹

如题：出现下图中的情况（设置reduceNum=5）感觉很奇怪，排除了很久，终于发现是一个第二次犯的错误：丢了这句this.mOutputs.close();加上这句，一切恢复正常！HadoopMultipleOutputs结果输出到多个文件夹出现数据不全，部分文件为空

系统 2019-08-12 01:32:49 3476

Hadoop

Hadoop namenode无法启动

最近遇到了一个问题，执行start-all.sh的时候发现JPS一下namenode没有启动每次开机都得重新格式化一下namenode才可以其实问题就出在tmp文件，默认的tmp文件每次重新开机会被清空，与此同时namenode的格式化信息就会丢失于是我们得重新配置一个tmp文件目录首先在home目录下建立一个hadoop_tmp目录sudomkdir~/hadoop_tmp然后修改hadoop/conf目录里面的core-site.xml文件，加入以下节

系统 2019-08-12 09:27:36 3471

Hadoop

配置RHadoop与运行WordCount例子

1、安装R语言环境su-c'rpm-Uvhhttp://download.fedoraproject.org/pub/epel/6/i386/epel-release-6-8.noarch.rpm'su-c'yuminstallfoo'yumlistR-\*yuminstallR2、安装RStudioDesktop和ServerDesktop是rpm包，双击执行Server安装命令：yuminstallopenssl098e#Requiredonlyfor

系统 2019-08-12 09:27:34 3440

Hadoop

使用Hadoop MapReduce 进行排序

本文转自：http://www.alidw.com/?p=1420在hadoop中的例子TeraSort，就是一个利用mapredue进行排序的例子。本文参考并简化了这个例子：排序的基本思想是利用了mapreduce的自动排序功能，在hadoop中，从map到reduce阶段，map出来的结构会按照各个key按照hash值分配到各个reduce中，其中，在reduce中所有的key都是有序的了。如果使用一个reduce，那么我们直接将他output出来就行

系统 2019-08-12 09:30:30 3429

Hadoop

【Hadoop】利用MultipleOutputs,MultiOutputFor

这是小D第一篇博客，有什么错误还请各位指正。小D也是刚接触Hadoop，因为在淘宝实习，有很多算法要在分布式环境下实现，所以这几天一直在看Hadoop，边用边学。最近实现的一个算法需要reduce输出很多参数，每个参数的格式不一样，而且要做为下一次mapreduce的输入，大家都知道Hadoop的分布式操作系统HFS是以目录为节点读取文件的，每个reduce输出一个分片，所以必须把要输出的文件根据类型的不同输出到不同的目录中去。因为淘宝还在用Hadoop0

系统 2019-08-12 09:29:27 3415

Hadoop

hadoop 入门

转载的。原文出自http://www.infosci.cornell.edu/hadoop/mac.htmlNOTICE:TheWebLabHadoopclusterwasclosedattheendofSeptember2011QuickGuidetoDevelopingandRunningHadoopJobs(MacOSX10.6)ThisguideiswrittentohelpCornellstudentsusingMacOSX10.6withset

系统 2019-08-29 22:57:00 3404

Hadoop

hadoop经典系列(十一)性能分析实验初步

【试验目的】本试验目的是为了总结hadoop相关参数优化对性能的影响。【试验环境】硬件环境本次试验用机4台，配置一致：CPU：Intel(R)Xeon(R)CPUE5620@2.40GHz*16内存：MemTotal:32867608kB64bitlinux版本CentOSrelease6.2(Final)内核版本2.6.32-220.el6.x86_64硬盘Model:IBMServeRAIDM5015(scsi)Disk/dev/sda:2997GBS

系统 2019-08-12 09:30:16 3400

Hadoop

hadoop经典系列(六)2.x的mapreduce过程图解

从业界使用分布式系统的变化趋势和hadoop框架的长远发展来看，MapReduce的JobTracker/TaskTracker机制需要大规模的调整来修复它在可扩展性，内存消耗，线程模型，可靠性和性能上的缺陷。在过去的几年中，hadoop开发团队做了一些bug的修复，但是最近这些修复的成本越来越高，这表明对原框架做出改变的难度越来越大。为从根本上解决旧MapReduce框架的性能瓶颈，促进Hadoop框架的更长远发展，从0.23.0版本开始，Hadoop的

系统 2019-08-12 09:30:06 3376

Hadoop

从Hadoop框架与MapReduce模式中谈海量数据处理

前言几周前，当我最初听到，以致后来初次接触Hadoop与MapReduce这两个东西，我便稍显兴奋，觉得它们很是神秘，而神秘的东西常能勾起我的兴趣，在看过介绍它们的文章或论文之后，觉得Hadoop是一项富有趣味和挑战性的技术，且它还牵扯到了一个我更加感兴趣的话题：海量数据处理。由此，最近凡是空闲时，便在看“Hadoop”，“MapReduce”“海量数据处理”这方面的论文。但在看论文的过程中，总觉得那些论文都是浅尝辄止，常常看的很不过瘾，总是一个东西刚要讲

系统 2019-08-12 09:29:27 3363

Hadoop

Hadoop入门（三）：Sqoop和Hive的使用

1安装Hive1.1下载解压wgethttp://mirrors.cnnic.cn/apache/hive/stable/hive-0.10.0.tar.gztarxzvfhive-0.10.0.tar.gz1.2配置环境变量exportHIVE_HOME=/usr/local/src/hive-0.10.0exportPATH=$HIVE_HOME/bin:$PATH1.3建立Hive仓库目录hadoopfs-mkdir/tmphadoopfs-mkdi

系统 2019-08-12 09:26:49 3309

首页
上一页
1
2
3
4
下一页
末页
共 4页,共50条

热门排行