Hadoop从零开始(一)什么是Hadoop
古时候,人们用牛来拉重物,当一头牛拉不动一根圆木的时候,他们不曾想过培育个头更大的牛。同样,我们也不需要尝试更大的计算机,而是应该开发更多的计算系统。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ---------格蕾斯·霍伯
首先在了解Hadoop之前,先来看看以下数据:据IDC估计2006年“数字全球”项目的数据总量为0.18ZB,并且预测到2011年这个数字将达到1.8ZB,为2006年的10倍。1ZB相当于10的21次方字节的数据,或相当于1000EB,1000000PB,或者大家更熟悉的10亿TB的数据,这相当于世界上每个人一个磁盘驱动器的数量级。Hadoop架构作为MapReduce算法的一种开源应用,是应对海量数据的理想工具。
Apache Hadoop项目简介?
其中MapReduce和HDFS是Hadoop的核心