一亩三分地

 找回密码 注册账号

扫描二维码登录本站

BBS
Offer多多
Salarytics
交友
Learn
Who's Hiring?
疫情动态
指尖新闻
Instant
客户端
微信公众号
扫码关注公众号
留学申请公众号
扫码关注留学申请公众号
Youtube频道
留学博客
关于我们
查看: 7096|回复: 50
收起左侧

[统计--就业] Data Scientist被雷-准备面试经验

    [复制链接] |只看干货 |统计--就业
我的人缘0

升级   99.5%


分享帖子到朋友圈
本楼: 👍   100% (26)
 
 
0% (0)   👎
全局: 👍   100% (147)
 
 
0% (0)    👎

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?注册账号

x
本帖最后由 大队管理员 于 2020-7-8 11:38 编辑

自从五月份通知被雷,到现在拿到一个Fortune 100的Senior DS的职位。很开心。过两天就要面FB,希望可以过onsite。这里分享一下我这一个半月准备的经验吧。

先说心路历程:被雷了之后还是心情很糟糕的,调整了一两周。然后也因为太久没有学习,整个脑子不在状态,感觉要学的好多,搞不清楚状况,遥遥无期。大概到了第三周慢慢进入状态,然后期间也有跌宕起伏,被亚麻最终轮拒,恼怒,灰心,再慢慢重拾信心,好好准备更多,到现在。

总结来说心态上最重要的是要清楚,”脑子跟肌肉一样,要循序渐进的提高。“刚开始100kg卧推可能不可思议,但是每天练习,每天进步一点,学习一点,早晚都可以实现100kg卧推。我大部分关于学习的理论都来自coursera ’learn how to learn'这门课。强烈推荐需要高强度突击学习的小伙伴,先去这里吸收一下经验。

接下来说要准备什么,和怎么准备。以下是我大致的准备顺序。但是明白一点,学习是循环的,最理想的方式是来回跳跃,当发现有联系的时候互相关联学习和记忆。
  • 统计学的东东
  • 机器学习的东东
  • Behavioral面试的东西
  • 自己做过的project的整理
  • 数据结构和算法
  • Product Sense


统计学和机器学习:
  • 资料强烈推荐一个Youtube-statquest。讲的很好,如果喜欢建议两倍速看一遍他关于统计和ml的playlist。
  • 基本概念搞清楚后专项突破。每一个类型的算法搞清楚原理,数学公式,优缺点,调参,实际应用。还有相似算法之间的对比总结。
  • 如果遇到不太清楚的,推荐的资料是:看论文原文(有些作者真的是大牛,讲的无比清晰);看python sklearn的document;去google找blog。一般来说前两者事半功倍。去接触最本源的知识是非常好的。
  • 先列一下ML必要知识点:Linear Regression (L1, L2, ElasticNet, Polynomial, Time Series, Seasonal, R square, adj-R, F-statistics), Logistic Regression (Sigmoid, Maximum-Likelihood, Pseudo-R), Tree (CART, Regression Tree, Ensemble, XGB, GBM, AdaBoost, RandomForest, Entropy, Gini, Missing Value, Feature Importance, Pruning, Regularization), SVM (All Kernal), Clustering (K-mean, Hclust, DBSCAN, Distance Metrics, Silhouette Score), Inbalance Classification/Outlier(One Class SVM, LOF, Isolation Forest, Clustering), Missing Value, Feature Engineering Techniques, Dimension Reduction(PCA, Auto-encoder, MDS, LDA), Underfitting & Overfitting.
  • 然后这是optional知识点:NLP (Word2Vec, Sentiment), Neural Network(Optimizer, CNN, LSTM, Tune, Regularization, Gradient Vanishing, Activation), Collaborative Filtering


Behavioral
  • 这块基本上是被亚麻的Leadership Principle虐了千百遍。一直用STAR结构答了他们50多个常见题。基本上可以用在任何其他家的面试上。多去看看大家怎么准备亚麻的Behavior就可以了

游客,本帖隐藏的内容需要积分高于 50 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.

评分

参与人数 64大米 +97 收起 理由
Yana + 1 给你点个赞!
buzhang_you + 1 给你点个赞!
cheval1995 + 1 赞一个
jenniening + 1 赞一个
noraaaaaaa + 2 谢谢分享!
qrqrqr + 1 很有用的信息!
Fake/Random + 1 赞一个
jackson3000 + 1 赞一个
4552dosen + 2 给你点个赞!
jeremy_sz + 2 给你点个赞!

查看全部评分


上一篇:cs背景做data science
下一篇:蜀黍转DS/ML: 求有工作经验的理工科背景的队友
我的人缘0

升级   99.5%

 楼主| dmindemon 2020-7-8 11:33:08 | 显示全部楼层
本楼: 👍   100% (4)
 
 
0% (0)   👎
全局: 👍   100% (147)
 
 
0% (0)    👎
孙早起 发表于 2020-7-7 23:21
感谢楼主分享。同样强推Youtube-statquest!

请问下楼主面的算法时候题目的难度?LC Medium难度左右?个 ...

不同的岗位有不同的要求:

ML岗一般都会考算法,难度都是Junior Software Engineer。
  • LC上Med level和Hard level都刷一刷。150肯定够了,但是你要保证自己在不看答案的情况下,可以很顺利的写下来,逻辑清晰。所以建议你多多练习,一次肯定不够的。练到自己能很清晰的理解思路,理解每一句的作用就可以了。一定要注重质量,而不是数量。有时候你认认真真刷明白10道不同解题方法的题可能就够了,关键是自己要掌握解题思路。
  • Dynamic Coding基本不考,XOR基本不考。这些高深的算法不会考。所以遇到这种题可以直接跳过或者用其他解法。
  • 好好练习BFS, DFS, Two Pointer, Linked List, Recursive ...  这些常用的就可以。
. 1point3acres

Data Scientist很多并不是ML engineer岗,不需要算法,只需要sql和python就可以。
  • 建议SQL LC上的Med 和 Hard level都刷会。一样注重质量,不要重数量
  • 然后去刷面经

评分

参与人数 3大米 +3 收起 理由
yanliangwu + 1 赞一个
cutekitty + 1 赞一个
孙早起 + 1 感谢楼主!

查看全部评分

回复

使用道具 举报

我的人缘0

升级   99.5%

 楼主| dmindemon 2020-7-9 07:49:32 | 显示全部楼层
本楼: 👍   100% (2)
 
 
0% (0)   👎
全局: 👍   100% (147)
 
 
0% (0)    👎
lalalalalalalal 发表于 2020-7-9 05:48
感谢楼主分享~想问一下ds级别的算法题需要掌握多深呀~我最近用python刷一些leetcode上的easy题目,比如链 ...

建议你去看Grokking the interview,里面除了dynamic programming和xor都是考点。你这个准备的可能有点偏了。大概率不会直接考你二叉树或者某种sort algorithm,更多的可能考你two pointer,binary search,bfs,dfs这种。还有leetcode easy太简单了,不会考那么简单的,基本是med - hard level。大概率med,hard考的少。比较是junior swe的bar

评分

参与人数 1大米 +1 收起 理由
sddlpeter + 1 赞一个

查看全部评分

回复

使用道具 举报

我的人缘0

升级   99.5%

 楼主| dmindemon 2020-7-8 11:35:22 | 显示全部楼层
本楼: 👍   100% (2)
 
 
0% (0)   👎
全局: 👍   100% (147)
 
 
0% (0)    👎
孙早起 发表于 2020-7-7 23:21
感谢楼主分享。同样强推Youtube-statquest!

请问下楼主面的算法时候题目的难度?LC Medium难度左右?个 ...

我面的FB的岗位,难度Med level
回复

使用道具 举报

我的人缘0

升级   0%

本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (7)
 
 
0% (0)    👎
很赞, 面fb 哪个组啊, 祝贺通过, fb 有些组data scientist 收入和swe是一样的
回复

使用道具 举报

我的人缘0

升级   97.86%

本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   93% (3570)
 
 
6% (232)    👎
想问一下,这些准备都花了多长时间呢?感觉60天不够用啊
回复

使用道具 举报

我的人缘0
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (90)
 
 
0% (0)    👎
感谢楼主分享经验~
回复

使用道具 举报

我的人缘0

升级   13.86%

本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   96% (863)
 
 
3% (31)    👎
加米了 楼主几年经验呀 面的是亚麻ds吗 祝offer满满
回复

使用道具 举报

我的人缘0

升级   16.43%

本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   83% (81)
 
 
16% (16)    👎
bluesun 发表于 2020-07-06 20:58:26
很赞, 面fb 哪个组啊, 祝贺通过, fb 有些组data scientist 收入和swe是一样的
你说的是core ds吧
回复

使用道具 举报

我的人缘0

升级   93.43%

光影流转 2020-7-7 22:44:58 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (113)
 
 
0% (0)    👎
感谢lz分享~

评分

参与人数 1大米 +1 收起 理由
zhimuwang + 1 赞一个

查看全部评分

回复

使用道具 举报

我的人缘0

升级   5.57%

孙早起 2020-7-7 23:21:31 | 显示全部楼层
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   100% (41)
 
 
0% (0)    👎
感谢楼主分享。同样强推Youtube-statquest!

请问下楼主面的算法时候题目的难度?LC Medium难度左右?个人感觉DS偏analytics或者ML面试算法难度是不是会不一样,我看面经有些面Analystics算法不考的都有,只考了SQL,但ML方向的算法有时候面得比较难。

不知道算法这一块该花多大精力准备。我是非CS专业,陆陆续续刷了150题LC,但很多还都是初刷。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号

本版积分规则

隐私提醒:
■为防止被骚扰甚至人肉,不要公开留微信等联系方式,请以论坛私信方式发送。
■特定版块可以超级匿名:https://pay.1point3acres.com/tools/thread
■其他版块匿名方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html

手机版|||一亩三分地

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

Some icons made by Freepik from flaticon.com

快速回复 返回顶部 返回列表