国内实习996,怎么安排时间准备秋招?

一亩三分地

 找回密码 注册账号

扫描二维码登录本站

最近看过此主题的会员


码农求职神器Triplebyte
不用海投
内推多家公司面试

瞄准秋招
跟Shawn一起刷算法题

Total Comp Calculator
输入offer信息
系统自动计算每年收入

科技公司如何
用数据分析驱动产品开发
coupon code: 20%off 打八折

深入浅出AB Test
从入门到精通
coupon code: 20%off 打八折
游戏初创公司招聘工程师、UIUX Designer和游戏策划
坐标湾区
DreamCraft创始团队
招聘游戏开发工程师
查看: 12437|回复: 106
收起左侧

Data Scientist new grad 面试考点总结 & 简短准备经历 【长文】

    [复制链接] |试试Instant~
我的人缘0

分享帖子到朋友圈
崔小宝 发表于 2019-4-22 11:27:29 | 显示全部楼层 |阅读模式
本楼: 👍   100% (146)
 
 
0% (0)   👎
全局: 👍   99% (351)
 
 
0% (1)    👎

2018(1-3月) 分析|数据科学类 硕士 全职@泛指 - 内推 - 其他  | Pass/Offer | fresh grad应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?注册账号

x
大家好,由于积分日益减少,我把找工总结的存货贴出来,希望能帮助到大家。当然,跪求积分与大米,我现在连找房找室友都搜不起了,恳请爸爸们可怜我...认识我的爸爸们请更加可怜我呜呜...此贴只有我见到考点总结与简短的准备建议,如果大家觉得有用的话我可以另写帖子记录 获取面试的方式、部分公司的面试经历、还有一些心得体会。
  • 职位包含 DS/DA/Quant/Engineering Rotator/Big Data/Bio-statistician...
  • 大小中型公司、金融、IT、药企 都有...
  • DS 的考点又杂又多,我的策略:基础考点深刻全面、进阶考点点到为止(学霸请忽略这句话、我基础很差)


一、统计类基础
1. 1 概率论和分布
•        大数定律. 1point3acres
•        中心极限定理
•        贝叶斯公式和条件概率
•        常见事件的分布、期望和方差
• 不同分布之间的关系
•        蓄水池抽样法了解一下(这个不知道归于哪一类,请允许我放这里)

1. 2 假设检验
•        一些基本概念,比如p-value, confidence interval
•        P-value怎样计算(离散分布/连续分布)
•        Bonferroni correction
•        假设检验下抽样分布的假设,包含检验正态性、齐方差、何时使用T-test、Z-test、基本的非参数检验;
•        要能够清楚地做出原假设和备择假设,并且已知 p-value时正确做出推断

1. 3 A/B TESTING
•        科技类公司会考,推荐Udacity里google 的 A/B test的课。
•        如何设计实验,如何选择合理的衡量metrics


1. 4 SIMULATION (就被考过一次)
• Inverse transformation
•        听说的没被考过,gibbs sampling


1. 5【准备经历】
• 我把同济大学《概率论和数理统计的》习题册、相关的简单例题做了两遍。
• 《A Practical Guide to Quantitative Financial Interviews》相关题目做了三遍,(用处:搞第一遍时想死,搞完三遍后变得对所有的统计应用题莫名有自信、并怀揣期待)
•        网络上的“统计 数学 面经”


二、ML/NLP - PROJECT相关
2. 1 一些建模的GENERAL问答
•        怎么找outlier
•        怎么搞missing value
•        怎样处理imbalanced data
•        Model evaluation 要清楚各个metrics的特点和适用情况
   a.        Cross-Validation、stratified cross-validation
   b. MSE,MAE,impurity function,cross-entrop,precision, recall, AUC, ROC, F1 …
• false positive 和 false negative:给出false positive比false negative更重要的例子
•        怎样选 feature
•        Overfitting, underfitting各自的表现和解决方式
•        Variance/bias trade-off
•        Out-of-bag sample
•        解释 gradient descent, stochastic gradient descent, mini-batch gradient descent…
•        Statistical learning 和machine learning的区别
• spherical hashing,我十分感觉这题超纲......不准备也罢。
•        没被考到过,但是个人觉得还是了解一下比较好的知识点:
   a.        Parametric / Non-parametric model
   b.        Generative / Discriminant model
   c.        Curse of dimension

. From 1point 3acres bbs
2. 2 REGRESSION. check 1point3acres for more.
•        线性回归的基本假设,违背基本假设时怎么办
•        如何衡量共线性,VIF
•        对比correlation和causation,分别如何测量
•        线性回归,对数据进行各种线性变换时模型怎么变,预测值、R方、系数等等怎么变
•        为什么OLS下残差和为零
•        根据residule plot和QQ-plot判断拟合得好不好
•        没被考到过但是我能想到的potential考点
   a.        Logistic 回归的参数怎么估计
   b.        Logistic回归的LOSS function的形式
   c.        线性回归中为什么使用OLS估计,OLS估计量的一些性质(BLUE)
-baidu 1point3acres
2. 3 REGULARIZATION
•        对比Lasso 和Ridge
• 不同的编程语言Lasso的结果一样吗?不一样,因为grid不一样。我也不知道考这个干嘛。<
游客,本帖隐藏的内容需要积分高于 188 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.
/strong>

•        Introduce yourself / walk me through your resume
•        Why us
•        Why you
•        Fail to do anything? what did you learn from that?
•        Biggest accomplishment
•        Negative / positive teamwork experience
•        Strength / weakness
•        Multi-task priority
•        Ask for help / help others – example
•        How do you see yourself in five years / career interest
•        Why choose statistics, why choose math (我math的本科)
•        Example solving difficulties / difficult time
•        Example persuade others
•        Example explaining technical concept to non-technical people
•        Example you use your intelligence in life event
•        Example of critical thinking
•        Others’ quality that you wish you have but you don’t
•        Biggest change after you came to US
【准备经历】:总结改造一些真实事例做模板;这类问题最重要的是 让面试官觉得舒服.... From 1point 3acres bbs


---------------------------------------
@版主大人:我真是想手动【精华】这个帖子,基本都是跪面试换来的考点,求个分呀求个米






. From 1point 3acres bbs


评分

参与人数 321大米 +593 收起 理由
danny.kuo + 1 给你点个赞!
smoothiethu + 1 很有用的信息!
jamie850530 + 4 赞一个
crystalcc + 1 很有用的信息!
Nana55 + 2 很有用的信息!
whusym + 2 给你点个赞!
jks5632 + 2 给你点个赞!
alittlestupid + 1 很有用的信息!
ivyjwyu + 3 给你点个赞!
JinnyHui + 1 给你点个赞!

查看全部评分


上一篇:Quantifind DS
下一篇:Two Sigma OA挂经

本帖被以下淘专辑推荐:

我的人缘0
admin 发表于 2019-4-23 01:04:50 | 显示全部楼层
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   93% (1342)
 
 
6% (95)    👎
本文被选为04/05/2019全站置顶文
游客,本帖隐藏的内容需要积分高于 10 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.
谢谢你的分享。
回复

使用道具 举报

我的人缘0
Fama 发表于 2019-4-22 11:41:11 来自一亩三分地官方APP | 显示全部楼层
本楼: 👍   100% (40)
 
 
0% (0)   👎
全局: 👍   100% (75)
 
 
0% (0)    👎
看看你写的这些
游客,本帖隐藏的内容需要积分高于 10 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.
太远了
回复

使用道具 举报

我的人缘0
zzrdwj 发表于 2019-4-23 09:04:38 | 显示全部楼层
本楼: 👍   100% (13)
 
 
0% (0)   👎
全局: 👍   84% (322)
 
 
15% (60)    👎
帮楼主补充几个常见的点:
1,概率:高频题目 rejection sampling,例如如何用一个random(2)随机数函数生成random(3)
2,Optimization:很重要的部分,包括基本的gradient decent, sgd,神经网络的bp,epoch和batch变化对训练结果影响,牛顿法(曾被考到过列举一个非gradient方法),lasso如何优化(不可导函
游客,本帖隐藏的内容需要积分高于 10 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.
原理,rnn和lstm和gru异同
5,emsemble tree:xgboost和gbm差别,一般说泰勒级数就行了

评分

参与人数 17大米 +20 收起 理由
Sybilye + 2 给你点个赞!
w5207 + 1 赞一个
xhlzyllx + 1 给你点个赞!
巴普洛夫的猫 + 2 很有用的信息!
ltang1839 + 1 给你点个赞!
shirrleyyy + 1 赞一个
puranustc + 1 谢谢分享!
派大星 + 1 赞一个
Constan + 1 赞一个
zhang.chi1 + 2 给你点个赞!

查看全部评分

回复

使用道具 举报

我的人缘1
tianjiayangmike 发表于 2019-4-22 13:02:29 | 显示全部楼层
本楼: 👍   100% (5)
 
 
0% (0)   👎
全局: 👍   100% (42)
 
 
0% (0)    👎
楼主有心了,我自己也在做类似的东西,希望楼主能允许我把你
游客,本帖隐藏的内容需要积分高于 10 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.
楼主最后去哪里了~
回复

使用道具 举报

我的人缘0
本楼: 👍   100% (4)
 
 
0% (0)   👎
全局: 👍   100% (36)
 
 
0% (0)    👎
好文章。。我我我看了
游客,本帖隐藏的内容需要积分高于 10 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.
好了。。
回复

使用道具 举报

我的人缘0
本楼: 👍   100% (4)
 
 
0% (0)   👎
全局: 👍   100% (31)
 
 
0% (0)    👎
感觉很全面啊 作为面试官最近的感觉就是如果能答出来这些问题 性格不错脑
游客,本帖隐藏的内容需要积分高于 10 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.
s formula都不知道
回复

使用道具 举报

我的人缘0
本楼: 👍   100% (2)
 
 
0% (0)   👎
全局: 👍   100% (10)
 
 
0% (0)    👎
算法题真的基本不怎么考
游客,本帖隐藏的内容需要积分高于 10 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.
越多算法题
回复

使用道具 举报

我的人缘0
HellVicky 发表于 2019-4-23 06:52:57 | 显示全部楼层
本楼: 👍   100% (2)
 
 
0% (0)   👎
全局: 👍   96% (31)
 
 
3% (1)    👎
谢谢lz分享!不过我通篇最注意的点还是这个字
游客,本帖隐藏的内容需要积分高于 10 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.
看着巨爽hhh
回复

使用道具 举报

我的人缘0
novavistamn 发表于 2019-5-12 21:23:50 | 显示全部楼层
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   93% (14)
 
 
6% (1)    👎
在职ds的表示我组tech lead都答不出来这些问题==b
贡献一下我们组面试常用的几个问题:
1) What's stochastic gradient descent?
2) How to deal with very imbalanced
游客,本帖隐藏的内容需要积分高于 10 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.
ssion?
5) How to prevent data leakage?

评分

参与人数 2大米 +2 收起 理由
yiren1201 + 1 很有用的信息!
崔小宝 + 1 赞一个

查看全部评分

回复

使用道具 举报

我的人缘0
zzrdwj 发表于 2019-4-24 12:23:49 | 显示全部楼层
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   84% (322)
 
 
15% (60)    👎
zhang.chi1 发表于 2019-4-24 11:26
楼主你好,想问一下你说到线性回归违背基本假设的话。都有什么解决办法啊?谢谢了,给lz加密了。感觉

statistical inference这本书上应该都有,一般来说有wls,对变量进行变换,处理异常值
回复

使用道具 举报

我的人缘0
白沂秋 发表于 2019-4-24 04:15:41 | 显示全部楼层
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   50% (7)
 
 
50% (7)    👎
thanks fo
游客,本帖隐藏的内容需要积分高于 10 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.
g!!!
回复

使用道具 举报

我的人缘0
方软软 发表于 2019-4-22 11:52:27 | 显示全部楼层
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   97% (48)
 
 
2% (1)    👎
太有用了!
游客,本帖隐藏的内容需要积分高于 10 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.
点赞
回复

使用道具 举报

我的人缘0
xiaohan0425 发表于 2019-4-22 12:20:04 | 显示全部楼层
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   98% (159)
 
 
1% (2)    👎
谢谢lz分享!
游客,本帖隐藏的内容需要积分高于 10 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.
用!!
回复

使用道具 举报

我的人缘0
 楼主| 崔小宝 发表于 2019-4-22 13:07:44 来自一亩三分地官方APP | 显示全部楼层
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   99% (351)
 
 
0% (1)    👎
tianjiayangmike 发表于 2019/04/22 13:02:29
楼主有心了,我自己也在做类似的东西,希望楼主能允许我把你这篇文章的一部分融合进去作补充~
想问下楼主最后去哪里了~

欢迎欢迎,能被 注明引用 很开心~ 等你总结好啦写好了也求分享嘻嘻!😊
回复

使用道具 举报

我的人缘0
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (3)
 
 
0% (0)    👎
感谢楼主分享
游客,本帖隐藏的内容需要积分高于 10 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.
油!
回复

使用道具 举报

我的人缘0
f.tumblr.oath 发表于 2019-4-22 21:11:43 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (1)
 
 
0% (0)    👎
Thanks fo
游客,本帖隐藏的内容需要积分高于 10 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.
ing
回复

使用道具 举报

我的人缘0
sherry1228 发表于 2019-4-22 21:43:53 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (2)
 
 
0% (0)    👎
赞一下~~~~~
回复

使用道具 举报

我的人缘0
光影流转 发表于 2019-4-22 23:13:26 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (44)
 
 
0% (0)    👎
已加米,感谢l
游客,本帖隐藏的内容需要积分高于 10 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.

回复

使用道具 举报

游客
请先登录
您需要登录后才可以回帖 登录 | 注册账号

本版积分规则

提醒:发帖可以选择内容隐藏,部分板块支持匿名发帖。请认真读完以下全部说明:

■隐藏内容方法 - 不要多加空格: [hide=200]你想要隐藏的内容比如面经[/hide]
■意思是:用户积分低于200则看不到被隐藏的内容
■可以自行设置积分值,不建议太高(200以上太多人看不到),也不建议太低(那就没必要隐藏了)
■建议只隐藏关键内容,比如具体的面试题目、涉及隐私的信息,大部分内容没必要隐藏。
■微信/QQ/电子邮件等,为防止将来被骚扰甚至人肉,以论坛私信方式发给对方最安全。
■匿名发帖的板块和方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html

手机版|小黑屋|一亩三分地

GMT+8, 2019-5-27 15:15

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表