当前位置: 首页>>hadoop 2.0之YARN>> 阅读正文

利用Hadoop Streaming处理二进制格式文件

Category: hadoop 2.0之YARN View: 7,004 Author: Dong
, ,

  • 评论 (4)
  • 引用通告 (0)
发表评论 发起引用

  • 1楼pimeson 回复

    Post: 2014-09-16 07:10

    楼主您好,请教一个问题:如果我想要处理的是二进制数据,来源于地震,原始数据中没有明显的key值,我需要先对原始数据进行处理,增加key值,然后才能MapReduce么?还是可以根据数据的偏移量,直接进行MapReduce?

    [回复]

  • 2楼moreBetter 回复

    Post: 2015-01-06 11:02

    您好,董老师,如果这个sequencefile很大时,hadoop自带的inputsplit分割方式会不会把该sequencefile分割坏呢?

    [回复]

  • 3楼mGuo 回复

    Post: 2015-01-07 09:31

    大神您好,实例源码不能下载,请您更新链接。

    [回复]

  • 4楼xmpy 回复

    Post: 2015-02-04 09:05

    您好,您的代码不能访问啦~能再传一份嘛 非常感谢~

    [回复]

目前还没有任何Trackbacks和Pingbacks.
发表评论