- 军军小站|张军博客

个人简介

java-web项目加密运行（支持window/linux）

网址导航

JAVA项目加密(Windows/Linux/Mac/龙芯系统)

视频讲解-Java调用DLL

Hadoop 集群傻瓜式搭建手记

关于Hadoop的配置，按照我的理解，应该有六个文件需要修改，它们都在Hadoop的conf文件夹下，分别是：masters/slavers：配置masters和slavers的机器IPhadoop-env.sh：Hadoop运行时的环境变量，比如JAVA_HOME，LOG之类的core-site.xml：Hadoop的核心配置文件，对应并覆盖core-default.xml中的配置项hdfs-site.xml：HDFS的配置文件，对应并覆盖hdfs-de

系统 2019-08-29 23:51:04 2960

Hadoop

MongoDB: Hadoop Integerateion 1

HadoopandMongoDBUseCasesThefollowingaresomeexampledeploymentswithMongoDBandHadoop.Thegoalistoprovideahigh-leveldescriptionofhowMongoDBandHadoopcanfittogetherinatypicalBigDatastack.IneachofthefollowingexamplesMongoDBisusedasthe“ope

系统 2019-08-12 09:30:37 2960

Hadoop

Hadoop API 使用介绍

原文地址；http://hi.baidu.com/befree2008wl/blog/item/dcbe864f37c9423caec3ab7b.htmlHadoopAPI被分成（divideinto）如下几种主要的包（package）org.apache.hadoop.conf定义了系统参数的配置文件处理API。org.apache.hadoop.fs定义了抽象的文件系统API。org.apache.hadoop.dfsHadoop分布式文件系统（HDF

系统 2019-08-29 22:09:43 2959

Hadoop

Hadoop 的 TotalOrderPartitioner

http://blog.oddfoo.net/2011/04/17/mapreduce-partition%E5%88%86%E6%9E%90-2/Partition所处的位置Partition位置Partition主要作用就是将map的结果发送到相应的reduce。这就对partition有两个要求：1）均衡负载，尽量的将工作均匀的分配给不同的reduce。2）效率，分配速度一定要快。Mapreduce提供的PartitionerMapreduce默认的

系统 2019-08-12 09:29:57 2957

Hadoop

Hadoop中shuffle阶段流程分析

宏观上，Hadoop每个作业要经历两个阶段：Mapphase和reducephase。对于Mapphase，又主要包含四个子阶段：从磁盘上读数据-》执行map函数-》combine结果-》将结果写到本地磁盘上；对于reducephase，同样包含四个子阶段：从各个maptask上读相应的数据（shuffle）-》sort-》执行reduce函数-》将结果写到HDFS中。Hadoop处理流程中的两个子阶段严重降低了其性能。第一个是map阶段产生的中间结果要写

系统 2019-08-12 09:30:30 2953

Hadoop

配置RHadoop与运行WordCount例子

1、安装R语言环境su-c'rpm-Uvhhttp://download.fedoraproject.org/pub/epel/6/i386/epel-release-6-8.noarch.rpm'su-c'yuminstallfoo'yumlistR-\*yuminstallR2、安装RStudioDesktop和ServerDesktop是rpm包，双击执行Server安装命令：yuminstallopenssl098e#Requiredonlyfor

系统 2019-08-12 09:27:34 2944

Hadoop

使用Hadoop MapReduce 进行排序

本文转自：http://www.alidw.com/?p=1420在hadoop中的例子TeraSort，就是一个利用mapredue进行排序的例子。本文参考并简化了这个例子：排序的基本思想是利用了mapreduce的自动排序功能，在hadoop中，从map到reduce阶段，map出来的结构会按照各个key按照hash值分配到各个reduce中，其中，在reduce中所有的key都是有序的了。如果使用一个reduce，那么我们直接将他output出来就行

系统 2019-08-12 09:30:30 2939

Hadoop

hadoop 入门

转载的。原文出自http://www.infosci.cornell.edu/hadoop/mac.htmlNOTICE:TheWebLabHadoopclusterwasclosedattheendofSeptember2011QuickGuidetoDevelopingandRunningHadoopJobs(MacOSX10.6)ThisguideiswrittentohelpCornellstudentsusingMacOSX10.6withset

系统 2019-08-29 22:57:00 2916

Hadoop

Install RHadoop with Hadoop 2.2 – Red Hat L

PrerequisiteHadoop2.2hasbeeninstalled(andthebelowinstallationstepsshouldbeappliedoneachofHadoopnode)Step1.InstallR(byyum)[hadoop@c0046220yum.repos.d]$sudoyumupdate[hadoop@c0046220yum.repos.d]$yumsearchr-project[hadoop@c0046220yum.

系统 2019-08-12 09:26:49 2914

Hadoop

Hadoop namenode无法启动

最近遇到了一个问题，执行start-all.sh的时候发现JPS一下namenode没有启动每次开机都得重新格式化一下namenode才可以其实问题就出在tmp文件，默认的tmp文件每次重新开机会被清空，与此同时namenode的格式化信息就会丢失于是我们得重新配置一个tmp文件目录首先在home目录下建立一个hadoop_tmp目录sudomkdir~/hadoop_tmp然后修改hadoop/conf目录里面的core-site.xml文件，加入以下节

系统 2019-08-12 09:27:36 2906

Hadoop

hadoop经典系列(十一)性能分析实验初步

【试验目的】本试验目的是为了总结hadoop相关参数优化对性能的影响。【试验环境】硬件环境本次试验用机4台，配置一致：CPU：Intel(R)Xeon(R)CPUE5620@2.40GHz*16内存：MemTotal:32867608kB64bitlinux版本CentOSrelease6.2(Final)内核版本2.6.32-220.el6.x86_64硬盘Model:IBMServeRAIDM5015(scsi)Disk/dev/sda:2997GBS

系统 2019-08-12 09:30:16 2874

Hadoop

【Hadoop】利用MultipleOutputs,MultiOutputFor

这是小D第一篇博客，有什么错误还请各位指正。小D也是刚接触Hadoop，因为在淘宝实习，有很多算法要在分布式环境下实现，所以这几天一直在看Hadoop，边用边学。最近实现的一个算法需要reduce输出很多参数，每个参数的格式不一样，而且要做为下一次mapreduce的输入，大家都知道Hadoop的分布式操作系统HFS是以目录为节点读取文件的，每个reduce输出一个分片，所以必须把要输出的文件根据类型的不同输出到不同的目录中去。因为淘宝还在用Hadoop0

系统 2019-08-12 09:29:27 2865

Hadoop

从Hadoop框架与MapReduce模式中谈海量数据处理

前言几周前，当我最初听到，以致后来初次接触Hadoop与MapReduce这两个东西，我便稍显兴奋，觉得它们很是神秘，而神秘的东西常能勾起我的兴趣，在看过介绍它们的文章或论文之后，觉得Hadoop是一项富有趣味和挑战性的技术，且它还牵扯到了一个我更加感兴趣的话题：海量数据处理。由此，最近凡是空闲时，便在看“Hadoop”，“MapReduce”“海量数据处理”这方面的论文。但在看论文的过程中，总觉得那些论文都是浅尝辄止，常常看的很不过瘾，总是一个东西刚要讲

系统 2019-08-12 09:29:27 2861

Hadoop

Hadoop入门（三）：Sqoop和Hive的使用

1安装Hive1.1下载解压wgethttp://mirrors.cnnic.cn/apache/hive/stable/hive-0.10.0.tar.gztarxzvfhive-0.10.0.tar.gz1.2配置环境变量exportHIVE_HOME=/usr/local/src/hive-0.10.0exportPATH=$HIVE_HOME/bin:$PATH1.3建立Hive仓库目录hadoopfs-mkdir/tmphadoopfs-mkdi

系统 2019-08-12 09:26:49 2860

Hadoop

hadoop经典系列(六)2.x的mapreduce过程图解

从业界使用分布式系统的变化趋势和hadoop框架的长远发展来看，MapReduce的JobTracker/TaskTracker机制需要大规模的调整来修复它在可扩展性，内存消耗，线程模型，可靠性和性能上的缺陷。在过去的几年中，hadoop开发团队做了一些bug的修复，但是最近这些修复的成本越来越高，这表明对原框架做出改变的难度越来越大。为从根本上解决旧MapReduce框架的性能瓶颈，促进Hadoop框架的更长远发展，从0.23.0版本开始，Hadoop的

系统 2019-08-12 09:30:06 2858

首页
上一页
1
2
3
4
下一页
末页
共 4页,共50条

热门排行