首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 软件管理 > 软件架构设计 >

hadoop 中平添和删除 datanode和tasktracker(二)

2012-09-11 
hadoop 中添加和删除 datanode和tasktracker(二)增加Hadoop新节点:向一个正在运行的Hadoop集群中增加几个

hadoop 中添加和删除 datanode和tasktracker(二)

增加Hadoop新节点:

向一个正在运行的Hadoop集群中增加几个新的Nodes

1. 新节点上部署java/hadoop程序,配置相应的环境变量

2. 新节点上增加用户,从master上拷贝id_rsa.pub并配置authorized_keys

3. 新节点上设置/etc/hosts,只要有本机和master的host即可

/etc/hosts

127.0.0.1       localhost

10.10.10.101 node1
10.10.10.102 node2
10.10.10.103 node3
10.10.10.104 node4


(在这个文件中要写上所有的namenode 和datanode 的ip 及对应的服务器名称(上面说的好像只需要写namenode的ip服务器名称就行了,这个有待试一下),所有的datanode 和namenode 下该文件的内容都是一样的)

4. 新节点上建立相关的目录,并修改属主,将Node4之中 ~/tmp目录下的内容都删除掉,否则会被认为已经创建的节点。

5. master的slaves文件中增加上相的节点(* 注意:只在NameNode之上配置就可以)

/etc/masters  (masters 是一个没有扩展名的文件,master里面存放的是secondary NameNode 的主机名)

node1

/etc/slaves    (slaves 是一个没有扩展名的文件,slaves里面存放的是taskTracker和dataNode 的主机名)   

node2

node3

node4

6. 在新节点上启动datanode和tasktracker

localadmin@node4:~/hadoop-0.20.2/bin$ hadoop-daemon.sh start datanode

localadmin@node4:~/hadoop-0.20.2/bin$ hadoop-daemon.sh start tasktracker

使用'Jps'进行检查。

7. 进行block块的均衡

在hdfs-site.xml中增加设置balance的带宽,默认只有1M:

<property> 
    <name>dfs.balance.bandwidthPerSec</name> 
    <value>10485760</value> 
    <description>
        Specifies the maximum bandwidth that each datanode can utilize for the balancing purpose in term of the number of bytes per second.
    </description> 
</property>

运行以下命令:

hadoop/bin/start-balancer.sh -threshold 3

均衡10个节点,移动400G数据,大概花费了3个小时

The cluster is balanced. Exiting…
Balancing took 2.9950980555555557 hours
============================================================

删除Hadoop节点:

 Hadoop提供了Decommission的特性,可以按照以下步骤来操作:

1. 在hadoop的conf目录下生成一个excludes的文件 /etc/nn-excluded-list,写上需要remove的节点

    一个节点一行,如:

node4

2. 在hdfs-site.xml中增加配置:

<property>    
    <name>dfs.hosts.exclude</name>    
    <value>/etc/nn-excluded-list</value>    
</property>

3. 复制文件到集群各节点上

4. 执行hadoop dfsadmin -refreshNodes命令,它会在后台进行Block块的移动

    从移出的Nodes上移动到其它的Nodes上面

5. 通过以下2种方式查看Decommission的状态:

    hadoop dfsadmin -report

    http://10.10.10.101:50070/dfsnodelist.jsp

    正在执行Decommission,会显示:

    Decommission Status : Decommission in progress

    执行完毕后,会显示:

    Decommission Status : Decommissioned6.下架目标机器后,再次编辑/etc/nn-excluded-list,把刚才下架的机器的ip或机器名移走

热点排行