首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 操作系统 > UNIXLINUX >

UNIX: 高效率管理大量计算机

2013-03-01 
UNIX: 高效管理大量计算机云在根本上是由硬件和软件组成的,这些组件需要经常细心地维护。出现故障的硬件需

UNIX: 高效管理大量计算机

云在根本上是由硬件和软件组成的,这些组件需要经常细心地维护。出现故障的硬件需要修理或更换;软件需要应用补丁、更新和升级;必须根据需求和潜在的安全威胁提前配置系统。应用程序开发人员可能觉得计算云很方便、很灵活,但是云管理员要应对艰巨的任务。

不只是云的管理有这些问题。LAN(小型服务器群)和计算集群也有同样的系统管理难题。在管理大量计算机时,Secure Shell (ssh)、scpsftp 等常用工具用起来非常麻烦。本期 对话 UNIX 讨论从命令行有效地管理大量计算机的技术,先从少量系统开始,然后扩大规模。

?

例如,命令 mssh.sh "example.com joe@sample.com" "uptime -a"> 在两台主机(example.com 和 sample.com)上运行 uptime -a。计算机名列表放在引号中以组成一个参数,由于同样的原因,命令也放在引号中。每个计算机名必须符合 ssh 要求的模式 — 如果远程用户名与本地用户名相同,那么使用 hostname;如果远程用户名与本地用户名不同,那么使用 username@hostname。运行 mssh.sh "example.com joe@sample.com" "uptime -a"> 会产生这样的结果:

?

这个脚本很原始,但是可以通过扩展它包含其他特性,比如用可调的超时设置防止在主机停机时出现长时间延迟(ssh -o 选项),用指定的目录捕捉输出。实际上,有许多按这种方式构建的软件包,可以简化分布式系统管理。其中之一是 Distributed Shell (dsh)。


此任务名为 search_libs。它连接 www.capify.org 并运行命令 ls -x1 /usr/lib | grep -i xml。Capistrano 通过角色 支持计算机组,还提供许多其他特性。通过 cap 命令启动任务,比如 cap search_libs。Ruby 和 Rails 开发人员广泛采用 Capistrano 把代码部署到服务器,但是对于自动执行大多数分布式系统管理任务,它也是非常好的工具。一些教程解释了如何结合使用 Capistrano 与 Java? 语言、Perl、Python 和其他编程语言,以及如何结合使用 Capistrano 与 Drupal and Expression Engine 等应用程序引擎。如果与源代码控制系统结合使用,Capistrano 的效果最好,但这不是必需的。可以通过 put 操作分发二进制代码。

Nagios。维护很重要,但是监视也很重要。停机和错误会在网络上造成严重破坏,尤其是在许多系统采用相同配置的情况下。Nagios 是一个开放源码监视程序,它可以监视服务器、服务、资源等。它的安装和部署很容易,可以通过任何 web 浏览器使用它。

还可以研究 Oak Ridge National Laboratory (ORNL) 的 Cluster Command and Control (C3) 和 pdsh 等计算集群工具。C3 操作 ORNL 的大规模计算集群,它提供大量命令行工具,可以减少操作和管理集群所需的时间和精力,提高系统管理员的生产力。pdsh shell 在许多方面与 pssh 相似,但是还可以管理系统映像。

用很少的时间管理大量计算机

使用 dsh 和 pssh 等工具能够节省时间并减少错误。可以在大量系统上运行相同的命令,几乎马上会看到组合的结果。通过清单把相似的计算机集中在一起可以降低遗漏的风险。Puppet 和 Capistrano 可以把经常重复执行的任务捕捉到脚本中。如果管理的计算机比较多,自动化就是关键。总之,如果采用适当的工具,计算云的管理也不难。

<!-- CMA ID: 594350 --><!-- Site ID: 10 --><!-- XSLT stylesheet used to transform this file: dw-document-html-6.0.xsl -->

?

参考资料

学习

对话 UNIX:阅读本系列中的其他部分。

rsync 命令家族(Federico Kereki,developerWorks,2009 年 4 月):了解 rsync 和基于 rsync 协议的各种实用程序。

AIX and UNIX 专区:developerWorks 的“AIX and UNIX 专区”提供了大量与 AIX 系统管理的所有方面相关的信息,您可以利用它们来扩展自己的 UNIX 技能。

AIX and UNIX 新手入门:访问“AIX and UNIX 新手入门”页面可了解更多关于 AIX 和 UNIX 的内容。

AIX and UNIX 专题汇总:AIX and UNIX 专区已经为您推出了很多的技术专题,为您总结了很多热门的知识点。我们在后面还会继续推出很多相关的热门专题给您,为了方便您的访问,我们在这里为您把本专区的所有专题进行汇总,让您更方便的找到您需要的内容。

AIX and UNIX 下载中心:在这里你可以下载到可以运行在 AIX 或者是 UNIX 系统上的 IBM 服务器软件以及工具,让您可以提前免费试用他们的强大功能。

IBM Systems Magazine for AIX 中文版:本杂志的内容更加关注于趋势和企业级架构应用方面的内容,同时对于新兴的技术、产品、应用方式等也有很深入的探讨。IBM Systems Magazine 的内容都是由十分资深的业内人士撰写的,包括 IBM 的合作伙伴、IBM 的主机工程师以及高级管理人员。所以,从这些内容中,您可以了解到更高层次的应用理念,让您在选择和应用 IBM 系统时有一个更好的认识。

技术书店:阅读关于这些和其他技术主题的图书。

获得产品和技术

dsh:这个 shell 可以并行地在许多计算机上执行 shell 命令。

pssh:Parallel ssh 并行地在许多计算机上运行命令、复制文件和管理进程。

Puppet:了解关于 Puppet 的更多信息,Puppet 是最流行的分布式系统管理工具之一。

Capistrano:访问 Capistrano 网站,了解如何用 Ruby 和 Capistrano 域相关语言编写管理脚本。

Nagios:这个开放源码监视平台可以与自动维护工具结合使用,提高任何规模的网络的稳定性。

ORNL Cluster Command and Control:C3 工具可以管理数百个计算机节点。

pdsh:这个计算机集群管理工具可以并行地在多台计算机上运行命令。

热点排行