`
caizhongda
  • 浏览: 184604 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

MAPREDUCE面试题

 
阅读更多
Map/Reduce功能很强大,只要设定合理Key、Value,我们经常碰到的算法大部分都可以实现。假如能把下面几个算法问题,用Map/Reduce方式实现,那么Map/Reduce编程可以说已经运用很纯熟了。

初级篇
0. 实现Word Count

中级篇
1. Map/Reduce方式实现矩阵相乘

2. Map/Reduce方式实现PageRank算法

3. Map/Reduce方式实现TF/IDF

4. Map/Reduce实现图最短路径

5. Map/Reduce实现最小生成树算法

6. Map/Reduce实现Aprori算法

7. Map/Reduce实现 Kmeans算法

你能做出来几个?













分享到:
评论
1 楼 wujiazhao88 2012-02-15  
我勒个去, 现在有mapreduce方面的面试题啦...

相关推荐

    MapReduce经典常见面试实操题

    MapReduce经典常见面试实操题,面试题,实操题,练习题,练手题

    大数据工作面试练习题 BAT大数据面试题 Hadoop、kafka、HDFS、Spark、MapReduce 共19页.pdf

    大数据工作面试练习题 2018最新BAT大数据面试题 Hadoop、kafka、HDFS、Spark、MapReduce 【内容大纲-共25道题目】 1、kafka的message包括哪些信息? 3 2、怎么查看kafka的offset? 3 3、hadoop的shuffle过程是? 3 ...

    大数据组件 Spark 面试题 + Spark 高频面试题

    里面有 Spark 的部署方式,spark core、spark sql、spark streaming 等组件的各种面试题,包括但不限于宽窄依赖、缓存、数据广播、shuffle以及数据倾斜的查看和解决方式等等 对于大数据(离线、在线)面试的同学还是...

    Hadoop 100道基础面试题

    关于hadoop的一些基础面试题,包括架构、源码、mapreduce、hdfs的基础面试题。提供一些基础的面试知识kaodian

    大数据面试题.docx

    a)它是 NameNode 的热备 b)它对内存没有要求 c)它的目的是帮助 NameNode 合并编辑日志,减少 NameNode 启动时间 d)SecondaryNameNode 应与 NameNode 部署到一个节点 大数据面试题全文共16页,当前为第2页。...

    Hadoop中的HDFS和Mapreduce

    Hadoop中的HDFS和Mapreduce详细的讲解,原理以及样例

    大数据面试题-.docx

     a)Martin Fowler 大数据面试题-全文共15页,当前为第1页。 b)Kent Beck c)Doug cutting 5. HDFS 默认 Block Size a)32MB b)64MB c)128MB 6. 下列哪项通常是集群的最主要瓶颈 a)CPU b)网络 c)磁盘 d)内存 7. 关于 ...

    大数据知识、面试题 HDFS、Mapreduce、hive

    kafka 数据丢失问题,及如何保证1. 数据丢失: a.acks=1 的时候(只保证写入 leader 成功),如果刚好 leader 挂了.数据会丢失. b. Acks=0 的时候, 使用异步模式的时候,该模式下 kafka 无法保证消息,有可能会丢。...

    大数据Spark面试题汇总

    大数据Spark面试题汇总,共有79道面试题以及题目的解答 部分题目如下: 1. spark 的有几种部署模式,每种模式特点? 2. Spark 为什么比 mapreduce 快? 3. 简单说一下 hadoop 和 spark 的 shuffle 相同和差异? 5. ...

    大数据面试题(1).docx

     b)Kent Beck 大数据面试题(1)全文共15页,当前为第1页。 c)Doug cutting 5. HDFS 默认 Block Size a)32MB b)64MB c)128MB 6. 下列哪项通常是集群的最主要瓶颈 a)CPU b)网络 c)磁盘 d)内存 7. 关于 ...

    2018最新BAT大数据面试题.docx

    把这份题目分享出来,给面试的程序员参考用。就设为最低分值吧,大家拿去。 题目示例如下: 15、MapReduce 中排序发生在哪几个阶段?这些排序是否可以避免?为什么? 1)一个 MapReduce 作业由 Map 阶段和 Reduce ...

    hadoop面试题

    面试hadoop可能被问到的问题你能回答出几个 ?...5、面试的人给你出一些问题,让你用mapreduce来实现? 比如:现在有10个文件夹,每个文件夹都有1000000个url.现在让你找出top1000000url。 6、hadoop中Combiner的作用?

    大数据开发面试题合集.pdf

    当应聘者面试大数据开发岗位时,以下是一些常见的面试题: - 1. 请解释一下什么是大数据(Big Data),并列举大数据的特征和应用场景。 - 2. 你熟悉的大数据技术栈有哪些?请简要介绍每种技术的作用和特点。 - 3. ...

    Hadoop基础面试题(附答案)

    Hadoop基础面试题(附答案)

    大数据面试题

    大数据面试题,涉及到MapReduce,hdfs,hive,flume,spark,kafka

    大数据面试题(2).docx

    大数据面试题(2) 大数据面试题(2)全文共26页,当前为第1页。大数据面试题(2)全文共26页,当前为第1页。1、给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url? 方案1...

    大数据底层原理和基础概念面试题30道

    2 、Hadoop和MapReduce的关系是什么? 3 、Hadoop中的HDFS是什么?它有哪些优点? 4 、HDFS的组成结构是什么? 5 、HDFS中DataNode和NameNode的区别是什么? 6 、Hadoop中的MapReduce的工作流程是什么? 7 、...

    最新Hadoop的面试题总结

    (3)Sort阶段:按照MapReduce语义,用户编写reduce()函数输入数据是按key进行聚集的一组数据。为了将key相同的数据聚在一起,Hadoop采用了基于排序的策略。由于各个MapTask已经实现对自己的处理结果进行了局部排序...

    大数据面试题.doc

    单项选择题 1. 下面哪个程序负责 HDFS 数据存储。 a)NameNode b)Jobtracker c)Datanode d)secondaryNameNode e)tasktracker 2. HDfS 中的 block 默认保存几份? a)3 份 b)2 份 c)1 份 d)不确定 3. 下列哪个程序通常与...

    Hadoop面试题(四)——YARN

      2)Yarn上可以运行各种类型的分布式运算程序(mapreduce只是其中的一种),比如mapreduce、storm程序,spark程序…… 3、HDFS的数据压缩算法?(☆☆☆☆☆)   Hadoop中常用的压缩算法有bzip2、gzip、lzo、...

Global site tag (gtag.js) - Google Analytics