当前位置: 首页>>大规模数据处理>> 阅读正文

怎样从10亿查询词找出出现频率最高的10个

Category: 大规模数据处理 View: 21,014 Author: Snailer
, , , , , ,

  • 评论 (3)
  • 引用通告 (1)
发表评论 发起引用

  • 1楼仪网 回复

    Post: 2011-05-19 07:49

    博主是高手!

    [回复]

  • 2楼X周 回复

    Post: 2013-05-27 03:10

    你好,想在hadoop做些实验,比如连接,能给推荐一下数据集么?

    [回复]

    Dong 回复:

    http://qing.blog.sina.com.cn/1641422615/61d61f1733003qea.html

    [回复]

    X周 回复:

    谢谢,如果在实验中遇到问题还会请教,祝生活愉快!!

    [回复]

  • 3楼kentvince 回复

    Post: 2014-06-14 09:59

    john 89
    tom 100
    mary 100
    mary 200
    tom 20
    ———–
    董老师,我刚学mapreduce,正在练习,上面这个我计算了很久也不对,就是对第一列去重,去重后应该是3
    如果用mapreduce计算成功后,part-00000 的文件内容 是:
    3
    请问下,这个mapreduce怎么写啊?

    [回复]

发表评论