一亩三分地

 找回密码 注册账号

扫描二维码登录本站

微信公众号
扫码关注公众号
留学申请号
扫码关注留学申请公众号
查看: 4308|回复: 57
收起左侧

2020-DS疫情跳槽小结和准备资料分享

    [复制链接] |只看干货 |数科面经, 面试经验
我的人缘0

升级   35%


分享帖子到朋友圈
本楼: 👍   100% (8)
 
 
0% (0)   👎
全局: 👍   100% (91)
 
 
0% (0)    👎

2020(10-12月) 分析|数据科学类 硕士 全职@ - 内推 - Onsite  | Pass/Offer | 在职跳槽

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?注册账号

x
本帖最后由 大队管理员 于 2021-1-5 13:58 编辑

2020年,历经2-3个月的准备,LZ从9月份到12月份在家密集面试了16家公司(包含apple, Amazon, adobe, google, twitter, uber, facebook等)与6场onsite,在刚开始连环拒的情况下最终拿到了一家大型tech firm senior DS的offer。很感谢地里的小伙伴无私奉献面经和准备经验,也写下我的经历供大家参考。

一、前期准备与面试期间的持续学习
面试之前的2-3个月,我整理了一份多个方面的学习清单和一个每日进度表,以记录我的学习情况。我着重复习了SQL, Data manipulation, product, Stats, A/B testing, ML等知识。我也订阅了Medium和leetcode,便于读Data Science相关的post和复习coding。

面试期间,针对各个公司,我又详细看了各个公司岗位的面经,针对特定的product与技术问题进行了深入的了解。在每一次面试后我会记录面试的情况和被问到的题目,如果在那次面试答得不好,会在接下来的时间着重复习和攻破这些知识点。

下面列一些我非常受益的资料:

1.SQL
  • leetcode SQL 刷完全部的题目
  • A collection of data science takehome challenges - SQL Database questions
  • 个人面试经验 - 载入dummy data面试后重新写一遍
  • 地里面经. From 1point 3acres bbs

. From 1point 3acres bbs
如果想要做题库之前快速复习一下SQL的知识,推荐这两个网站:


2.Data manipulation (Python)
目前的工作常需要用pandas和numpy,所以就着重复习了一些比较advanced的知识点。
好的复习材料:
  • A collection of data science takehome challenges - SQL Database questions - 用pandas再写一遍
  • 地里面经(主要着重复习了groupby, rolling mean, 各种aggregate functions)
  • 不错的medium post: How to write sql queries in pandas:
  • https://medium.com/jbennetcodes/how-to-rewrite-your-sql-queries-in-pandas-and-more-149d341fc53e-baidu 1point3acres


3.Stats & probability
  • 整理word版常见stats&probability知识点:

这一部分主要参考了地里对于Stats频繁问到的问题以及答案,在这个基础上加入一些个人的理解和其他平台相关定义的知识讨论。
statistic how to: https://www.statisticshowto.com/ 这个网站对我复习各类hypothesis testing有很大的帮助
. From 1point 3acres bbs
  • Inferential Statistics

https://www.coursera.org/learn/inferential-statistics-intro
  • Linear Model:

https://www.coursera.org/learn/ml-regression



  • 特定公司面经:

比如FB rds非常喜欢问linear model,问的非常细致。要对每个细节的改变对model的影响都有了解,建议仔细回顾一下。

  • Probability部分被问到的公司不多,主要了解conditional probability, baythes therom,各类distribution以及适应的product场景,以及知道怎么解答一些基础概率问题(类似投色子等)
. 1point3acres

4.machine Learning
  • 整理word版常见machine learning知识点:

这一部分主要参考了地里对于Machine Learning频繁问到的算法问题以及答案,在这个基础上加入一些个人的理解和其他平台相关定义的知识讨论。
由于很多公司对于算法的理解要求很高,建议有空的同学从数学推导出发,看看elements of statistical learning和medium,对算法的每一个步骤,优缺点,数学公式,optimization方法都有所理解。
  • 个人面试经验 - 因为DS的要求很广,很多时候就算你认为你复习了全部,面试官问到的问题可能是你没有看过的。所以每次在被问倒以后我都会好好看一下特定的问题。比如linear discriminant analysis与naive bayes的区别与联系等。再比如手写kmeans被问到了好几次。
  • 地里的必要/optional 知识点checklist - (这里援引地里小伙伴的总结):

先列一下ML必要知识点:. 1point3acres
Linear Regression (L1, L2, ElasticNet, Polynomial, Time Series, Seasonal, R square, adj-R, F-statistics)
Logistic Regression (Sigmoid, Maximum-Likelihood, Pseudo-R)
Tree (CART, Regression Tree, Ensemble, XGB, GBM, AdaBoost, RandomForest, Entropy, Gini, Missing Value, Feature Importance, Pruning, Regularization)
SVM (All Kernal). From 1point 3acres bbs
Clustering (K-mean, Hclust, DBSCAN, Distance Metrics, Silhouette Score)
Imbalance Classification/Outlier(One Class SVM, LOF, Isolation Forest, Clustering)
Missing Value
Feature Engineering Techniques
Dimension Reduction(PCA, Auto-encoder, MDS, LDA)
Underfitting & Overfitting.
Evaluation metrics

然后这是optional知识点: NLP (Word2Vec, Sentiment), Neural Network(Optimizer, CNN, LSTM, Tune, Regularization, Gradient Vanishing, Activation), Collaborative Filtering


5.A/B Testing and Product


1. Define metrics: sanity checking metrics, evaluation metrics
2. Design experiments: unit of diversion, target population (population impacted by the treatment, increase statistical power), size of experiment (statistical power), duration of experiment (traffic allocation, novelty effects, change aversion)
3. Analyze results: clean data, sanity checks (use sanity checking metrics defined in step 1), single evaluation metric (t-test, p value, type I error, type 2 error), multiple evaluation metrics (Bonferoni correction, FWER, FDR)

  • medium和地里的一些AB Testing 与product相关讨论&面经 - 这一部分要有批判性地去阅读。有时候地里的讨论能给你一定的思路,但不一定是ground truth。一定要自己好好思考
  • 吃透A collection of data science takehome challenges - 40道product问题,并且总结每种场景的答题的基本思路和framework (比如metric突然下降,如何评估产品health,是否加一个新的feature等等)
  • Cracking product case interviews书
  • Lean Analytics主要看e-commerce和mobile platform
  • Victor Cheng - Ivy Case system,基础consulting case答题结构

-baidu 1point3acres

6.Behavioral
  • 由于我面过amazon onsite,根据准备亚麻LP的方法准备其他家是一个不错的策略。总结好自己常用的故事库,然后尽量在回答behavioral的时候回答到点,不重样。对于一些可能没有完全准备过的问题,不要慌,尽量想办法联系到已经准备过的问题(比如我在面亚麻的时候面试官问我:Tell me an example where you influence the career of another person)
  • 此外,尽量对面试公司的产品和组的业务有所了解,回答why changing job的时候把回答变得personal一些,加入自己对于这个岗位的理解和兴趣。


游客,本帖隐藏的内容需要积分高于 50 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.

最近跳槽不容易希望这个帖子给大家一些参考,希望大家都尽快拿到理想的offer!

评分

参与人数 67大米 +143 收起 理由
winkkkkky + 2 给你点个赞!
linearFreddie + 1 很有用的信息!
RacoonYY + 1 赞,接好运
FrankBOKI + 1 给你点个赞!
caroline36310 + 1 赞一个
christiecc + 2 很有用的信息!
阿松XFAW + 2 给你点个赞!
flywei0228LRZG + 2 给你点个赞!

查看全部评分


上一篇:字节二面模型比较问题请教
下一篇:Intuit面经

本帖被以下淘专辑推荐:

我的人缘0

升级   35%

本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   100% (91)
 
 
0% (0)    👎
Yuedandanyue 发表于 2021-1-5 12:47
请问楼主可以分享整理的ML 知识点word 么

你好,ML的知识点大的结构我是参考了地里的资料。
如下几个帖子对我很有帮助:-baidu 1point3acres
https://www.1point3acres.com/bbs/thread-472184-1-1.html
https://www.1point3acres.com/bbs/thread-493659-1-1.html
https://www.1point3acres.com/bbs/thread-696423-1-1.html
还有要提到的是我给这个word做了个目录然后打了出来,复习的时候看起来很方便。希望有帮助!

评分

参与人数 3大米 +3 收起 理由
gradelyzxy + 1 给你点个赞!
borabora2020 + 1 赞一个
qli243 + 1 给你点个赞!

查看全部评分

回复

使用道具 举报

我的人缘0

升级   0.4%

本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   90% (150)
 
 
9% (16)    👎
本帖最后由 uniwander 于 2021-1-5 11:45 编辑

必须赞

说实在的,现在DS面试什么都有可能考到,这些知识点随便哪一个都是一个PhD可以研究的方向,期望面试者什么都懂,其实哪一个都不精通。加上没有标准流程,最后基本看缘分。
回复

使用道具 举报

我的人缘0

升级   21.05%

本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   94% (2543)
 
 
5% (158)    👎
DS现在考的太杂了,楼主这么短的准备时间,拿到不错的offer,恭喜
回复

使用道具 举报

我的人缘0

升级   54%

本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   99% (351)
 
 
0% (2)    👎
感谢lz 分享默默问下lz Twitter面的是ads吗?过几天要面试想问问面经
回复

使用道具 举报

我的人缘0

升级   35%

本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (91)
 
 
0% (0)    👎
小南衣 发表于 2021-1-5 07:12
感谢lz 分享默默问下lz Twitter面的是ads吗?过几天要面试想问问面经

你好。面的不是ads呢,但也是product向的。可以看看之前地里那篇。我被问到了问不能用pandas的基础coding,follow up怎么优化,以及一道product题目和基础的ab testing知识。

评分

参与人数 4大米 +6 收起 理由
gradelyzxy + 1 很有用的信息!
dreamchaserljz + 2 给你点个赞!
biubiula + 2 给你点个赞!
小南衣 + 1 赞一个

查看全部评分

回复

使用道具 举报

我的人缘0

升级   1.48%

本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (27)
 
 
0% (0)    👎
感慨一下应聘DS职位要准备这么多内容。。。
回复

使用道具 举报

我的人缘0

升级   23%

本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   96% (114)
 
 
3% (4)    👎
lz最后去哪了呀~
回复

使用道具 举报

我的人缘0

升级   35%

本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (91)
 
 
0% (0)    👎
biubiula 发表于 2021-1-5 09:24
lz最后去哪了呀~

最后去的公司私信你了~

评分

参与人数 2大米 +3 收起 理由
qli243 + 1 给你点个赞!
biubiula + 2 给你点个赞!

查看全部评分

回复

使用道具 举报

我的人缘0

升级   93.43%

本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   90% (20)
 
 
9% (2)    👎
请问如何在2,3个月的时间里复习这么多知识点? 每天大约学习几个小时? 谢谢!
回复

使用道具 举报

我的人缘0

升级   35%

本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (91)
 
 
0% (0)    👎
pengzhao0524 发表于 2021-01-04 17:38:08
请问如何在2,3个月的时间里复习这么多知识点? 每天大约学习几个小时? 谢谢!
我面试前的那几个月也有看。所以加上面试正式开始的几个月,一共大概学了4-5个月吧。每天大概2-3个小时。周末全天

评分

参与人数 1大米 +1 收起 理由
qli243 + 1 很有用的信息!

查看全部评分

回复

使用道具 举报

我的人缘0

升级   93.43%

本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   90% (20)
 
 
9% (2)    👎
mylo_xyloto 发表于 2021-1-5 09:42
我面试前的那几个月也有看。所以加上面试正式开始的几个月,一共大概学了4-5个月吧。每天大概2-3个小时。 ...

那你的效率也还是很高的. 感谢分享!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号

本版积分规则

隐私提醒:
■拉群请前往同学同事飞友|拉群结伴版块,其他版块拉群,帖子会被自动删除
■论坛不能删帖,为防止被骚扰甚至人肉,不要公开留微信等联系方式,请以论坛私信方式发送。
■特定版块可以超级匿名:https://tools.1point3acres.com/thread
■其他版块匿名方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html

手机版|||一亩三分地

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

Some icons made by Freepik from flaticon.com

快速回复 返回顶部 返回列表