首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 开发语言 > 编程 >

[Hadoop]MultiInput跟MultiOutput

2012-12-21 
[Hadoop]MultiInput和MultiOutput摘自象书一个Job里可以从多个同质或异质的输入源读取数据,并使用各自的Ma

[Hadoop]MultiInput和MultiOutput
摘自象书


一个Job里可以从多个同质或异质的输入源读取数据,并使用各自的Mapper

MultipleInputs.addInputPath(conf, ncdcInputPath,    TextInputFormat.class, MaxTemperatureMapper.class)MultipleInputs.addInputPath(conf, metOfficeInputPath,    TextInputFormat.class, MetOfficeMaxTemperatureMapper.class);



MultiOutputFormat可以让你按一定规则指定、分隔reduce output的文件名,如
...static class StationNameMultipleTextOutputFormat    extends MultipleTextOutputFormat<NullWritable, Text> {        private NcdcRecordParser parser = new NcdcRecordParser();        protected String generateFileNameForKeyValue(NullWritable key, Text value,        String name) {      parser.parse(value);      return parser.getStationId();    }  }...


另有MultiOutputs类,在此不表

热点排行