Hive的入门装配

2013-12-13

Hive的入门安装hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供完

Hive的入门安装
hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供完整的sql查询功能，可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低，可以通过类SQL语句快速实现简单的MapReduce统计，不必开发专门的MapReduce应用，十分适合数据仓库的统计分析。

Hive最早由facebook开源，最初用于解决海量结构化的日志数据统计问题，是一个ETL工具，
Hive的一些应用场景如下：
日志分析
统计网站一个时间段内的pv、uv
多维度数据分析
大部分互联网公司使用Hive进行日志分析，包括百度、淘宝等
其他场景
海量结构化数据离线分析
低成本进行数据分析（不直接编写MR）

本篇，散仙来介绍下Hive的安装与部署，Hive并不是一个分布式的系统，所以它的安装相对来说，还是比较容易的，在Hive安装之前，确保你的hadoop环境已经成功搭建，并可以正常启动，散仙的配置版本是，hadoop1.2.0的版本，hive0.10的版本。

我们，先来总结下Hive的安装步骤：

其次，我们要在HDFS上创建，对应的hive的table的存放位置目录，截图如下：

接下来，我们需要最重要的东西了，hive-site.xml,重命名hive-default.xml.template为hive-site.xml，修改其中几项即可：




最后，退出的命令，使用exit即可。

查看更多下一篇

本文网址：https://www.reader8.net/jiaocheng/20131213/2215411.html

读书人精选

热点排行

Solr搜寻配置关联词synonyms

错误解决： Tomcat平台出现Java heap sp

Iphone cover flow 开源兑现

机器学习中的数学(五)-强大的矩阵奇异值

win7将本地文件复制到远路虚拟机中

解决tomcat默认45s启动超时的有关问题

Gearman-java,请求和响应要花费这么多时

joda datetime测试经验

Struts2批量安插

Ogre基础教程2

开源软件

Hive的入门装配