一亩三分地

 找回密码 注册账号

扫描二维码登录本站


Salarytics=Salary Analytics
查询工资数据
系统自动计算每年收入

科技公司如何
用数据分析驱动产品开发
coupon code 250off 立减$250

深入浅出AB Test
从入门到精通
coupon code 250off 立减$250
游戏初创公司招聘工程师、UIUX Designer和游戏策划
坐标湾区
DreamCraft创始团队
招聘游戏开发工程师
把贵司信息放这里
查看: 5995|回复: 35
收起左侧

聊一聊作为3M data science面试官的体验以及小建议

  [复制链接] |试试Instant~
我的人缘0

分享帖子到朋友圈
huanyi | 显示全部楼层 |阅读模式
本楼: 👍   85% (6)
 
 
14% (1)   👎
全局: 👍   97% (36)
 
 
2% (1)    👎

2017(7-9月) 分析|数据科学类 博士 全职@3m - 校园招聘会 - Onsite 校园招聘会  | Pass/Offer | fresh grad应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?注册账号

x
先说一下我自己的背景18年博士ME毕业,进入3M做data scientist 方向是manufacturing
因为组里DS少,manager让我负责了两年我们自己组里DS 岗位的新生招聘

先说一下3M的新生招聘(rapid recruiting)流程(技术岗位 1. core(3M的传统强项material,chemistry, bio, physics ..., 对象phd 2. Data Science,对象phd + master,各种专业背景都会考虑)
我来说说data science (core也是八九不离十)
首先网申:3M有target schools,这些学校可以在学校的网站handshake等直接申请,然后3M八九月会派人去各个target school进行校园宣讲和现场面试(这一部分我没有参与组里经费问题,然后列年都是主要由另一个专做AI DS的组负责),这个渠道简历基本上是会被招聘团队看到的
如果你不是target的school,找人内推(这个人要么在招聘团队,要么认识招聘团队的人,这样才可以让你的简历被看到!)说白了这个路子运气有很大的成分。

面试流程:1.校园面试 andor 电话面试(八月以及九月初),2.onsite interview (十月)

3M筛候选人的步骤:target school的挑一部分简历进行校园面试和电话面试,然后给评语反馈回3M的招聘库。 HR会把表里打分及格和及格以上的人整理出来发给各个需要招DS的hiring manager,然后hiring manager根据自己组里岗位的需求进行挑选,这里他们可能只看简历及评语,也可能会给一个cold call聊一下。然后每个hiring manager都会邀请他们心目中的top candidates,基本上一个坑一两个人的样子。这些candidates是会参加rapid recruiting event,最后选你的人可能是 host 你的hiring manager,也可能别的组。所以一个人可能收到不同组的offer, 你自己选择哪个。

结合这样的面试流程和筛选步骤,我给些建议
游客,本帖隐藏的内容需要积分高于 50 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.

onsite的面试中,面试官们其实对candidate的心理就很微妙了,对于面试官来说,一年一次的机会,如果从这里没有招到新人就要等下一年,这一年间可能budget 问题不会有太多机会招新人,各个组可以抢对方的candidate,以及和别的公司抢你们,所以一定程度上我们也希望可以吸引你们来选择我们而不是把我们当备胎

题库什么的不存在,面试中technical question也都是依照简历来,简历没有写到的,可能会问一下有没有做过或者了解的,有会加分但是没有也不会深究。毕竟如果你欠缺的技术背景是我们很看中的话,就不会给你打电话。。。当然啦,你可以通过这个问题来表达一下你是一个可以快速学习并且可以熟练运用一个领域的技术到另一个领域的人。比如说我17年面试的时候,老板问我python会不会,我说不会,但是我会C++和matlab,语言嘛都差不多,一个会了另一个学很快的。我老板哈哈一笑说我记你简历上了。老板问我有没有做过image相关的项目,我说没有,但是基础知识有,并且和我做的其他project有一定的可转换性。他那年不是重点找搞image的,所以选我也没问题,当然如果那年有个人和我其他方面差不多,但是会python或者有image经验,那可能就不会选我了。后一年我们就只看了computer vision背景的candidates

在工业4.0的大背景下,工业界对DS的抢人才还是很激烈的,很多公司offer都越发越早,所以大家请一定要早点开始准备,这样机会来了不会因为你的准备欠佳而错失。技术是一方面,表达能力也是重点。不管是在校还是在职,表达能力都要持续去锻炼改进,原则其实很简单,简洁有逻辑,讲述时自信抓重点。






评分

参与人数 26大米 +139 收起 理由
wclin2 + 2 很有用的信息!
adorming + 1 给你点个赞!
jiaerhx + 1 给你点个赞!
Alohav + 2 很有用的信息!
shinan88888 + 2 给你点个赞!
yinge2612 + 2 给你点个赞!
cao793 + 1 赞一个
wwyi1828 + 2 给你点个赞!
JennyPEJW + 1 很有用的信息!
Philosophie + 2 很有用的信息!

查看全部评分


上一篇:IBM NA data scientist coding challenge题目
下一篇:前天的亚麻DS电面挂经 - 新人求经验值/大米/各种-谢谢

本帖被以下淘专辑推荐:

我的人缘0
 楼主| huanyi 2019-9-22 12:31:02 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   97% (36)
 
 
2% (1)    👎
wwtpcsuper 发表于 2019-9-22 08:04
如果楼主能再介绍一下3M的data science具体在做什么项目那就更好了~

我来补充一下3M的data scientist大概都是什么方向
首先如果对于不知道3M这个公司的可以自行google一下,这个公司非常的神奇以及有意思,产品可能覆盖了你生活的方方面面,各个领域。主要被熟悉的是化工材料相关专业领域
3M的DS两个比较大的方向是生产线,还有产品。当然DS还有招的就是针对finance,supply chain,sales,marketing等,不过这几块暂时我还没有发现选人在我说的rapid recruiting里,招的人都是他们的O2program或者business analytics,本科master之类的,不太sponsor。
我所说的这个岗位是针对偏科研一些,会sponsor,方向主要是研究如何开发有效的AI算法用于生产线(帮助提高质量和生产效率相关的)和产品开发,或者产品function的增加。大家可以google些关键字digital/smart factory,工业4.0, material informatics. 另外还有一些产品相关的我应该不可以说太多,我只知道他们宣讲的例子是路标的recognition,因为3M做那个路标的film。

碰到的数据可能量很大,也可能量很小,还有可能有些数据有有些数据需要进一步挖掘或者想其他方法来代替,数据有可能有label有可能没有或者不准确,有些问题不是直接告诉你这个是一个数据分析问题,需要你自己从问题以及已知信息(可能是物理模型,经验,or数据)来判断并且定义出一个problem statement然后通过数据分析的方法来解决。这也是为什么我说需要你对数据分析有很深刻的理解,同时也是为什么说沟通能力很重要,因为你的project合作对象他可能是化学家或者生产线的管理人员,对数据分析或者AI这个领域不是很清楚,找你可能是抱着死马当活马医的态度(当然大多数是相信这条路子是可以一定程度上解决问题的)。
另外和其他数据分析的公司类似,也有很多数据类型和问题暂时还需要新的算法开发来解决,这个可能会涉及机密,所以我也不具体多说。

评分

参与人数 1大米 +30 收起 理由
admin + 30 谢谢分享!

查看全部评分

回复

使用道具 举报

我的人缘0
铅笔 2019-9-22 02:39:37 | 显示全部楼层
本楼: 👍   100% (6)
 
 
0% (0)   👎
全局: 👍   87% (63)
 
 
12% (9)    👎
-baidu 1point3acres
这样面试感觉挺糟糕的。现实生活里许多时候项目并没有很清晰的逻辑,某一个方法能用,或者不能用也未必有很好的解释。可能同一个大的数据集,再采样一次之后之前的方法就无效了。或者同一个场景,过几个月之前训练得到的方法完全因为过拟合无法使用。你这样招到的人大概率是报告能力很优秀的人,但未必适合真的在公司里工作。最极端的情况候选人看了大量他人开源的项目,重复每一个细节修改之后来面试,按照你这样的流程来筛选,是完全看不出来的。
回复

使用道具 举报

我的人缘0
donnice 2019-9-23 04:43:29 | 显示全部楼层
本楼: 👍   100% (3)
 
 
0% (0)   👎
全局: 👍   88% (1653)
 
 
11% (205)    👎
铅笔 发表于 2019-9-22 04:35
问题是,能够说服他人的“逻辑”并不一定可以用。反过来,逻辑上无法说服人的方法在现实当中可能反而会效 ...

我个人不是十分同意你的说法。

公司招人的最终目的不是解决未知的问题,不是搞科研(某些纯research部门除外),而是拓展公司的业务,给公司挣钱。解决未知的问题是手段,是方法,不是目的。

这样一来这个问题就非常清晰了,你的的确确需要“短时间内让人明白你在说什么”的能力,因为你的老板或者你自己需要说服公司或者你的客户花钱支持你的项目和做法,而无论是上级领导还是客户的时间都有限,只能给你一个小时。你能不能调理清晰、合情合理地用人话向对方展示出来“为什么这条路是可行的”就极其重要。

我同意你说的机器学习中许多实验是反直觉的,没错。但作为一门实验性很强的学科,if you never step out for the first step,you never know whether it is right or wrong. 那你会选择随机拿一个最后可能被证明是对的、但目前为止被大部分人认为八杆子打不着边的模型作为开端呢,还是拿一个被过去的经验证明可行、但最终未必是最优解的模型呢?我想正常人都会选择后者。是的,R&D有很多偶然,有很多奇思妙想,但是这种巧合在大部分情况下都unreliable。常规的解决问题都是有一套标准的流程的,用我们工程师的话说,这就是所谓的engineering sense,而这种engineering sense正是LZ需要考察面试者的。如果某个面试者根本没有标准可靠的engineering sense,也不懂business value,只是瞎猫碰上死耗子地选到了一个收敛最快的模型,这个面试者就真的可靠么?即使TA的技术可靠,我怎么去相信TA能说服领导,说服客户?人终究要面对的是现实。. check 1point3acres for more.

私以为,工业界所谓优秀的数据科学家并不一定能最快找到参数最优的模型,但最后一定是最能给出该模型一个pursuasive的、reasonable的以及extensible的解释的专家。所以LZ考察的点合情合理,也是业界数据科学家最需要的品质
回复

使用道具 举报

我的人缘0
本楼: 👍   100% (3)
 
 
0% (0)   👎
全局: 👍   88% (1653)
 
 
11% (205)    👎
我比较好奇,像3M这样传统的化工公司里,DS的定位是什么?帮助科学家解决科研问题?还是帮市场部分析客户需求?谢谢
回复

使用道具 举报

我的人缘0
铅笔 2019-9-22 04:35:48 | 显示全部楼层
本楼: 👍   100% (2)
 
 
0% (0)   👎
全局: 👍   87% (63)
 
 
12% (9)    👎
huanyi 发表于 2019-9-22 03:38
首先我不同意你说很多项目是没有很清晰的逻辑的。一个项目过来你理解项目背景,目的是什么,然后看相关数 ...

问题是,能够说服他人的“逻辑”并不一定可以用。反过来,逻辑上无法说服人的方法在现实当中可能反而会效果很好。机器学习领域有许多这样反直觉的现象。你讨论这个的前提是“从这个处理过程中可以看到应试者是怎么思考的”对实际工作有帮助。但是事实并不是这样子,更重要的是这个处理过程在给定时间内能给出切实的结果。我听过的一些报告,主讲人直接说“我们过去知道它能用,但是完全不相信(因为不符合逻辑)。现在过了两年,我们才开始知道为什么它能用”。

我已经不是第一次碰到这种奇怪的情况,招聘需要的不是能够做事的人,而是“可以清楚表达”的人。做项目不是帮助总统竞选,也不是给五分钟面向大众的学术报告,需要想办法“短时间让人明白你在说什么”。你看一下Unofficial Google Data Science blog上面的文章,几乎没有任何一篇是可以几句话把背后的逻辑说清楚的。这些都是他们具体做过的(或尝试过,失败了的)工作。

这个问题其实陈天奇也讨论过: 常见的科学研究要么是问题驱动,比如“如何解决ImageNet分类问题”;要么是方法驱动,如 “RBM可以用来干什么”。当时的我同时锁死了要解决的问题和用来解决问题的方案,成功的可能性自然不高。公司招人的最终目的是解决未知的问题,并不是为了进行方法上进一步的探索。这个时候反而要求应试者能够给出清晰,干净,逻辑上自洽,能够短时间被同行理解的解决问题的方案,在我看来是自相矛盾的。至于怎么解决这个问题,你可以自己想一想。
回复

使用道具 举报

我的人缘0
 楼主| huanyi 2019-9-22 03:38:29 | 显示全部楼层
本楼: 👍   100% (2)
 
 
0% (0)   👎
全局: 👍   97% (36)
 
 
2% (1)    👎
本帖最后由 huanyi 于 2019-9-22 03:39 编辑
铅笔 发表于 2019-9-22 02:39
这样面试感觉挺糟糕的。现实生活里许多时候项目并没有很清晰的逻辑,某一个方法能用,或者不能用也未必有 ...

首先我不同意你说很多项目是没有很清晰的逻辑的。一个项目过来你理解项目背景,目的是什么,然后看相关数据,根据不同数据类型和目标不同选择不同的方法(可能做一些cleaning,statistics分析分析结合domain knowledge来挑选feature,根据你自己的假设来选模型),这些都是有逻辑的,当然不同的人会有不同的选择方向,但是都是有你自己的逻辑的。你的举例如果之后的采样后模型失效了,那你肯定是要找原因的,是因为之前训练集信息量不够,还是选取的feature问题,还是之前选择的模型容易出现overfitting的情况。很多实际情况下,数据量是达不到一个完美模型的,但是从这个处理过程中可以看到你是怎么思考的。你说的这个列子的处理过程是个很好的面试答案。

其次你说如果有人看了别人的开源项目可以深刻理解其中的步骤和原理,明白后面的逻辑我不觉得之后他会不适合公司里的工作。我自己的经历是对于DS的项目,你只看别人的项目去复述是没有用的,要思考过才能真的理解每一个步骤为什么做这个(或者有没有别的方法做)而思考的过程必定是要求你上手去试的。我在PhD时期帮导师带学生,学生会给我汇报进度,除非我和他一起思考过每个步骤,否则光看他的报告是没办法有深入的理解的。

这里我可能没有写清楚:我说的根据你的项目背景问不是只让你来一一说项目。比如你说你做过time series,那我可能给你一个基于time series假设的题目,来问如果以下情况你怎么处理。这个时候你可以用项目里的经历学到的经验来回答。干讲你怎么讲?对不对。
. From 1point 3acres bbs
说实话工业界数据碰到的问题真的是千奇百怪,你如果可以灵活运用自己所学到的和项目经历来回答,我觉得是很好的加分。可以清楚表达我想说真的不容易也很重要,第一如果你如果对自己要说的东西一知半解,那很难说服别人,第二如果你不能让人家明白你在讲什么那也是没法说服别人。第三如果短时间你没法让人明白你在说什么,很多人是会失去耐心和注意力的,这样就更不明白你在说什么了。

当然任何的面试流程不可能是完美的。如果有好的面试他人方法也请分享一下谢谢

评分

参与人数 2大米 +31 收起 理由
admin + 30
虎脸大猫咪 + 1 赞一个

查看全部评分

回复

使用道具 举报

我的人缘0
 楼主| huanyi 2019-9-23 10:14:03 | 显示全部楼层
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   97% (36)
 
 
2% (1)    👎
铅笔 发表于 2019-9-22 04:35
问题是,能够说服他人的“逻辑”并不一定可以用。反过来,逻辑上无法说服人的方法在现实当中可能反而会效 ...

这么说吧
当你发现反直觉或者现有逻辑的现象时,你会不会去研究为什么?(敲重点朋友们又一个很好的面试题,以及给面试的人show off的机会,不仅体现了你的科研能力,也体现了你的好奇心和做事严谨)如果你研究了,这个就是用来作为你和对方沟通的原理和你为什么觉得这个路子是行的通的逻辑,如果你没研究,那从我的角度来说不好意思你不是一个合格的工程师or科学研究人员。另外如果你没有明白你自己的一步一步什么原理什么逻辑,出问题了都不知道从哪个点开始找。就拿你前面重新sampling之后模型失效了为例子,你怎么办?再次大力出奇迹挨个模型参数试一次?有时候数据源头就出问题了,然后你还以为自己模型问题。

另外招聘是要找能够做事,而是要找做事可靠的。这个面试官只能从你的讲述中判断。他们也给不了你三个月试用期对吧。而且就算给你试用期,也不可能天天跟着看你做事能力如何。有时候事情的成败有很多因素,比如这个数据就是不能够支撑解决这个问题的,那么你要来沟通告诉他们why?how to improve data or work around?,或者你在项目期间已经做到一定地步了,很好的思路但是由于时间关系结果还没有出来,那这个时候又回到你用你的表达能力来给他们汇报or解释了why,what you did, why do you think it would eventually work,然后maybe说服他们再给你三个月(这些都是你可能在项目中会碰到的)

通常一个项目,你会觉得哎呀两三分钟我怎么可能把这么复杂我用了几个月一两年的事情给你说清楚呢。可是你可以不用都说吧,less is more。根据面试官的问题,选一个合适的重要的点切入讲清楚就可以了,不要从头到尾有的没的都给说了,n多个点都给事无巨细的想都倒出来。另外请给面试官一些机会,follow up questions里你可以继续发挥。

至于你提到科学研究的两种驱动,我觉得是很好的。(我觉得这也是为什么这几年3M大力推动AI招很多DS的人。一方面3M有很多问题需要找方案解决,另一方面3M也想看看AI是不是可以给他们带来新的东西。)不管是哪种驱动对于我们来说都要理解各种方法的使用原理和问题的特征吧。我同意很多是试出来的,可是试出来之后请倒回去想想为什么,这个是一个研究人员或者说工程师的基本素养啊。如果你和我说一件事,前后矛盾,或者说不出个所以然来,你让我怎么相信你是会做,并且能做好呢?

你想让对方在没有和你一起工作或者了解你的情况下认可你,基本上表达能力是很重要的一部分(我不是说全部,你要有料才能表达)

最后大部分公司大部分岗位还是以解决问题为主的,甚至可以说R&D其中一部分也是解决问题(解决问题中其实是有很多创新的),另一部分就是想想怎么把一些八竿子打不找的东西们给捣鼓个东西出来,弄点新效益。
(大家有兴趣可以查查3M的发展史,3M有些明星产品就是其他产品实验中的失败品的重新包装和利用哈哈。)
回复

使用道具 举报

我的人缘0
kgme 2019-9-22 06:25:52 | 显示全部楼层
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   94% (85)
 
 
5% (5)    👎
公司给的TC共多少?有没有股票?
回复

使用道具 举报

我的人缘5
wwtpcsuper 2019-9-22 08:04:28 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   95% (1004)
 
 
4% (42)    👎
如果楼主能再介绍一下3M的data science具体在做什么项目那就更好了~
回复

使用道具 举报

我的人缘0
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (11)
 
 
0% (0)    👎
3M 是啥
回复

使用道具 举报

我的人缘0
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   97% (35)
 
 
2% (1)    👎
前两天在学校面了3M的第一轮,过了快一个月才来叫我onsite。 不过有意思的是他们的onsite是三天的行程,不知道里面有什么。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号

本版积分规则

提醒:发帖可以选择内容隐藏,部分板块支持匿名发帖。请认真读完以下全部说明:

■隐藏内容方法 - 不要多加空格: [hide=200]你想要隐藏的内容比如面经[/hide]
■意思是:用户积分低于200则看不到被隐藏的内容
■可以自行设置积分值,不建议太高(200以上太多人看不到),也不建议太低(那就没必要隐藏了)
■建议只隐藏关键内容,比如具体的面试题目、涉及隐私的信息,大部分内容没必要隐藏。
■微信/QQ/电子邮件等,为防止将来被骚扰甚至人肉,以论坛私信方式发给对方最安全。
■匿名发帖的板块和方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html

手机版||一亩三分地

GMT+8, 2019-10-19 02:19

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表