成功搭建hadoop集群后简单实验 【百科全说】-凯发k8官方旗舰厅

腾讯视频/爱奇艺/优酷/外卖 充值4折起

  1> 检查对hdfs的访问(在namenode上操作)

  #./hadoop-0.20.2/bin/hadoop fs -ls

  2> hadoop中的文件系统操作

  #./hadoop-0.20.2/bin/hadoop fs -mkdir test

  #./hadoop-0.20.2/bin/hadoop fs -ls test

  #./hadoop-0.20.2/bin/hadoop fs -rmr test

  3> 测试hadoop

  a> 创建子目录

  #./hadoop-0.20.2/bin/hadoop fs -mkdir input

  b> 把本地文件移动到hdfs

  #./hadoop-0.20.2/bin/hadoop fs -put /usr/share/doc/pam-1.1.1/rfc86.0.txt input

  #./hadoop-0.20.2/bin/hadoop fs -put /usr/share/doc/pam-1.1.1/linux-pam_sag.txt input

  c> 查看文件是否存在

  #./hadoop-0.20.2/bin/hadoop fs -ls input

  d> 执行计算单词频率的mapreduce作业

  #./hadoop-0.20.2/bin/hadoop jar /root/hadoop-0.20.2/hadoop-0.20.2-examples.jar wordcount input output

  found 2 items

  drwxr-xr-x - root supergroup 0 2012-11-26 04:25 /user/root/output/_logs

  -rw-r--r-- 2 root supergroup 8315 2012-11-26 04:25 /user/root/output/part-r-00000

  e> 查看输出结果

  #./hadoop-0.20.2/bin/hadoop fs -ls output

  #./hadoop-0.20.2/bin/hadoop fs -cat output/part-r-00000 | head -n 13

  f> 从hdfs提取输出

  #./hadoop-0.20.2/bin/hadoop fs -get output/part-r-00000 output.txt

02/09 03:34
linux环境:centos6.4 hadoop版本:hadoop-1.1.2 master: 192.168.1.241 namenode jobtracker datanode tasktracker slave:192.168.1.242 datanode tasktracker 内容:想hadoop文件系统中上传一个大文件,验证文件分别分布在192.168.1.241节点和192.168.1.242节点上。 第一步: 前期工作:搭建hadoop集群, 在hdfs-site.xml中的配置
07/29 04:48
要在hadoop集群运行上运行jni程序,首先要在单机上调试程序直到可以正确运行jni程序,之后移植到hadoop集群就是水到渠成的事情。 hadoop运行程序的方式是通过jar包,所以我们需要将所有的class文件打包成jar包。在打包的过程中,无需将动态链接库包含进去。 在集群中运行程序之前,hadoop会首先将jar包传递到所有的节点,然后启动运行。我们可以在这个阶段将动态链接库作为附件和jar包同时传递到所有的节点。方法就是给jar命令指定-files参数。命令如下: hadoop ja
12/17 09:08
[it168 技术]故障转移群集可以配置使用多种不同的配置.组成群集的服务器可以是活跃状态或不活跃状态,而不同服务器可以被配置为在活跃服务器故障后立刻接管相应的资源.一般故障转移的过程只需要几分钟的时间,至于时间的长短主要取决于群集的配置和具体应用,当节点处于活跃状态时,该节点上可以使用所有资源. 当服务器故障后,在这台服务器上配置了故障转移群集的资源组就会被其他服务器所接管.当故障服务器重新上线后,群集服务可以配置为允许让原服务器进行故障回复,或者是让当前服务器继续处理新的客户端请求.本文章将

hadoop多台机器集群的配置

03/14 14:20
以前也配置过hadoop集群,但是很久没有重新去倒腾配置的细节,导致这次走了不少弯路。为了让后来的人少走弯路,也给我自己留个提醒,于是就有了这篇文章。 首先配置这个集群主要包括三个部分。三个部分各自都有自己的milestone,可以在配置完之后运行相关的测试来校验是否配置成功。 1.准备工作 这之前最好是预先有了几台相同用户名(要特别注意,对于用户名不同的话ssh的时候还需要用户名的信息。)的vm或者主机。我用的三台vm用户名都是hzm 机器的ip分别为192.168.28.13
12/17 14:58
前言 经过一周多的摸索,终于在vmware 中把windows2003 sqlserver2005 集群安装 起来了,纸上得来终觉浅,绝知此事要躬行,看来是很有道理的。安装过程往往是卡在一些不起眼的小地方,而网络上的绝大部分文章多多少少似乎都有意隐藏了些什么,呵呵,最终能搞定得益于邹建的文章。 sqlserver 集群有些类似于oracle 的rac ,但sqlserver 的集群其实只能称为故障转移集群,数据库 只能运行在单一的节点上,性能上得不到任何提升,只能从高可用性上得到受益。 在系统安
01/12 02:42
一、基于nat的lvs的安装与配置 1. 硬件需求和网络拓扑 2.下载软件: (1)、内核源代码:需要下载2.4.23以后版本的内核源代码。下载地址为http://www.kerner.org.本文中下载的内核源代为:linux-2.4.30.tar.bz2. (2)、用户配置工具ipvsadm,下载地址:http://www.linuxvirtualserver.org/software/ipvs.html.本文下载的是:http://www.linuxvirtualserver.org/so
10/05 13:23
centos 7下怎么搭建高可用集群。高可用集群是指以减少服务中断时间为目的的服务器集群技术。它通过保护用户的业务程序对外不间断提供的服务,把因软件/硬件/人为造成的故障对业务的影响降低到最小程度。那么新的centos下怎么来搭建高可用集群。 环境:本文以两台机器实现双集热备高可用集群,主机名node1的ip为192.168.122.168 ,主机名node2的ip为192.168.122.169 。 一、安装集群软件必须软件pcs,pacemaker,corosync,fence-
10/06 21:26
centos 7下怎么搭建高可用集群。高可用集群是指以减少服务中断时间为目的的服务器集群技术。它通过保护用户的业务程序对外不间断提供的服务,把因软件/硬件/人为造成的故障对业务的影响降低到最小程度。那么新的centos下怎么来搭建高可用集群。 环境:本文以两台机器实现双集热备高可用集群,主机名node1的ip为192.168.122.168 ,主机名node2的ip为192.168.122.169 。 一、安装集群软件必须软件pcs,pacemaker,corosync,fence-agents
12/01 22:22
======================================= f5全称: f5-big-ip-gtm 全球流量管理器. 是一家叫f5 networks的公司开发的四~七层交换机,软硬件捆绑. 据说最初用bsd系统,现在是linux;硬件是intel的pc架构,再加周边的网络和专用加速设备. 当然要提提售价, 都是几十万rmb的身价. 这宝贝是用于对流量和内容进行管理分配的设备,也就是负载均衡. 从名字就能看出来:big-ip. 外部看来是一个ip,内部可却是几十台应用服务器.表
网站地图