马上要去面试数据科学家,有过来人能分享一下这个职位的面经吗?
经验没有,只有教训,分享出来,希望对题主有点参考价值。
一面:技术人员面,先自我介绍,项目经验相关介绍,问比较细,问了一些Hadoop、Hbase的问题,JAVA基础,JVM内存分配小于32G原因,G1和CMS对比,问关系型数据库事务级别,脏读、幻读意思。
问题回答情况:其中G1与CMS区别我只讲了G1比CMS更耗CPU,但回收更快效果更好,两者内存划分设计不同,G1更适合大内存等,具体原因及细节没讲清;脏读、幻读只回答出跟数据库事务有关,面试当时忘记了具体什么叫脏读,什么叫幻读,有点分不清。这两个好像都没有答好,然后面试官问了我待遇期望。
二面:隔了4天,打电话过来让我去二面,是部门经理面,其也是做技术的。上来让我自我介绍,然后就围绕我讲的开始问。讲到之前项目中通过hbase的coprocessor的endpoint方式在服务端通过jni调用c++写的算法库实现数据计算过滤功能,然后这位经理就问为什么你们图像识别相关的CV算法不用JAVA写,要用C++?
我感觉有点懵逼,惊叹怎么会有这么小白的问题,但面上不能表现出来,简单回答说现在大部分算法都是通过C/C++写的,JAVA因为JAVA是完全面向对象的特性及jvm的关系,不适合做这么底层的事情,性能会有损耗。但似乎对方没有理解和听懂,表情带着不理解和质疑,半天从他嘴里吐出一个结论:你们不用JAVA写算法是因为你们公司搞算法那帮人只用C/C++去搞。
我当时有点无语,不知道该怎么跟这种对CV算法一无所知的人解释(或许我该说很多算法库都是C/C++写的,让你用JAVA调用cuda的库你累不累),但对方又接着问下一个问题,你怎么看待大数据领域接下来的发展趋势?
这个问题我从来也没想过,脑袋里突然冒出前阵子参加的云栖大会有个分会上讲得一些片段,糊里糊涂的瞎说了几句,说spark很热,使用的人非常多,后续也会集成流处理技术的一些新特性,另外说现在很多集群完全部署在云上,将来网络瓶颈解决有可能会往云上和云下自己管理的集群结合的这种方式发展。
这个答得的确不好,有点以偏概全了,对方显然对我这个回答很不满意,又问你认为磁盘IO性能会是瓶颈吗?
我回复说这个是目前大数据领域集群的主要瓶颈,但这个问题还好,应该会被克服改善(我想说可以把冷、热数据分离,热数据用速度快的SSD之类存储,但我没说出来)。
对方的目光有点嘲弄的感觉,不是很友好,后来就是问一些期望待遇及让我提问之类的环节。
结果:over,好吧,无所谓了,安慰自己,本来就不是很想去那边,因为自己偏实干型怕活太少(有点自虐),大概了解到的是对方的员工都过得偏安逸。
猜你喜欢内容
-
怎样提高阅读理解能力
首先,我们要对“阅读理解能力”及对四级阅读理解的具体要求作一定的了解。教学大纲要求 “较强的阅读能...
-
怎样使句子多样化
句子是由词或短语按语法规则组成,表达一个完整意思的语言单位。好的英语句子应该是结构意思正确完整,...
-
我是如何过六级的
不管四级还是六级,真题绝对重要!!!那些乱七八糟的模拟题或是其他的什么资料纯粹是浪费钱,我第一次...
-
如何充分利用好听力真题
根据听真题的不同层次,基本上,可以把听题分为以下五个阶段: 1. 初听 众所周知,听真题时的第一感觉...
-
如何进行判断和推理
在阅读中,人们首先理解的是语言的字面意义。然而,语言所表达的内容常常超过其字面意义。这就需要我们...
-
如何抓主题思想
主题思想(the Main Idea)。也称作中心思想,是作者在文章中要表达的核心内容,也是作者自始自终要说明的...
-
如何确定作者的观点或态度
一篇文章不可避免地反映了作者的观点、态度和情绪。能否正确把握作者的观点和态度也是体现阅读能力的重...
-
如何找主要事实特定细节
在文章中,作者总是要通过许多具体内容(Details)来说明、解释、证明或分析文章的主题思想。在通读全文、...
-
如何猜测词义
在阅读中,我们往往会遇到一些不认识的单词或短语,或者认识的单词在文章中有了新意义。如果这些词或短...
-
我的跨跨跨专业考研
这是本人第一次发贴。偶从hj上发掘资源供自己使用已久,今年又勉强获得读硕的机会,因此对hj上的xdjm心...






















