`
cloudeagle_bupt
  • 浏览: 545698 次
文章分类
社区版块
存档分类
最新评论

沈阳研发一二三面

 
阅读更多

转自:http://www.dajie.com/corp/2811939/discuss/209854


14号笔试之后焦急的等了一天两天三天,看着周围的小伙伴们一个个都接着电话通知面试去了,我的电话还是迟迟不来。17号是面试最后一天,上午听同学说系统可能出了点问题有些人没通知到,我立马杀到了面试现场。还好现场小姑娘说好像对我名字有点印象,刨了半天把我的简历试卷找了出来。有惊无险的搭上了研发面试的末班车。
上午11点,现场除了测试和算法的,就剩我一个研发了。初面的是一个胖胖的小哥,对我研究的方向挺感兴趣。一面基本都是hadoop方面的,问的比较深。现在回忆下主要有这么几个问题:
1、谈一下hadoop的工作机制(主要谈了下心跳机制)
2、说一下mapreduce的详细过程(这个主要说了map如何文件写本地,如何通知master,master再通知reduce去什么地方拉取数据等,hr挺满意)
3、hadoop如何判断一个任务失败,失败了怎么做
4、作业提交之后都发生了什么
5、他们项目有500亿记录,每条记录100列,现在用Hive对某些列做groupby,但是速度太慢了问我怎么改进。(这个真是撞大运了,我说完我的想法后hr说他们也是这么解决的)
6、画了个曲线图说多线程或者mapreduce总会有那么几个拖后腿的老完不成怎么办(我脑子一抽大笔一划说拖后腿的全干死,大数据下没人会关注数据全不全,缺那么几个不影响,响应速度第一。hr很吃惊,说谷歌也是这么干的)
7、写段代码,1到1000,统计出1的个数。我写的时候我看hr在我简历后面写评语,简历上画个A,然后说推荐我进入二面。
休息五分钟后,换个地方继续二面,二面继续问hadoop的问题。
首先问了个hadoop单点登录的问题,主要是多用户权限问题
然后问了点hbase相关的查询及优化问题,主要聊了hbase的region机制以及多线程。给hr看了个图片,1700W里随机查找10000条记录时间200ms左右

mapreduce动态倒排问题
mapreduce相似连接
hadoop维护中数据恢复技术
问道维护的时候随手拿出我的诺基亚神机给演示了下hadoop的操作

然后写了两个小代码
一个二分查找,一个堆排序
剩下的就比较轻松了,问一下平时都干嘛,最后我们很愉快的聊了聊杭州的美景跟美女

吃饭回来继续三面,一个中年大叔面我。继续是hadoop,问的显然有了深度,主要是架构方面的,问我觉得hadoop最大的缺陷在哪里,可以有什么改进等,最后又写了一段小代码关于正则表达式的。
晚上六点半,收到阿里电话,明天谈offer,圆满

总结:自己研究的东西一定要研究透,问的都是比较有深度的。自己搞不明白的就别写简历了
熟悉的一定得回答干脆果断
实在不会的不要狡辩
写代码是必不可少的

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics