首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 其他教程 > 开源软件 >

hive洪量数据-统计一年网站各个产品的UV

2013-02-20 
hive海量数据--统计一年网站各个产品的UVselect count(1) as uv,productfrom (select id,product,sum(1) a

hive海量数据--统计一年网站各个产品的UV
select count(1) as uv,product from (select id,product,sum(1) as c from year2012 where log_date>='2012-01-01' and log_date<='2012-12-31' group by id,product cluster by id,product) f group by product;

?第二种方案:map数9940 ? ?设置reduce数 100,运行时间为20分钟;

在遇到很多数据量时,需要多种转换,第二种方案,

第一个阶段:

根据id和product来分配该条记录分配到哪个reduce上:cluster by id ,然后用group by id,product去重;

第二阶段:

统计每个产品的条数即为该产品的uv。

?

热点排行