📣 VIP通行证夏日特惠 限时立减$68
查看: 24336| 回复: 42
跳转到指定楼层
上一主题 下一主题
收起左侧

Data Science 学习+面试准备清单

 
全局:

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x
楼主统计ms, 工作两年多。 工作中大部分时间处理数据,感觉可以学习到的少之又少了。
每天都有种随时要被市场淘汰的感觉。。. .и
过去大半年,零零碎碎的学习+面试了一些大大小小公司(科技类,数据公司,hedge fund都有),. Χ
小公司的offer想想还是拒了, dream companies 挂的也是横七竖八,通过店面或者onsite挂也是知道自己的短板不少。
消沉了好一阵TT~,痛定思痛,还是按k姐所说,开楼列出学习准备清单。 一定要坚持,求监督!

1. coding
楼主没有 任何cs背景,可以说找工前才开始接触data structure and algo。lc半年来零零碎碎蛮力刷了easy+部分medium。面试经验来看ds难度完全够,data engineer就很悬了(挂过某投行家的codepad).google  и
强烈建议建个excel,可以按提题号难度sort 和日期sort,这样才对自己的刷题进度熟悉,方便温故知新. 1point3acres.com
楼主刷了100多道时还是决定补一补基础课。如果是新手建议一边上课一边刷
Princeton Robert Sedgewick Algo I&II  https://www.coursera.org/learn/algorithms-part1
k姐推荐的书:
Problem Solving with Algorithms and Data Structures using Python
http://interactivepython.org/courselib/static/pythonds/index.html

2. Stats & Probability
上周因为这个原因挂了一个hedge fund。学统计的把这种基础忘了真的是我不挂谁挂。
以前为自己找了各种理由不看绿皮书,如今是学习不规范,自己两行泪!
这次准备把里面概率和brain teaser的部分刷一下。
传送门:https://github.com/Fan-Yang-Econ ... ce%20interviews.pdf
另一本书有空也可看下:
fifty challenging problems in probability with solutions
https://mbapreponline.files.word ... _problems_in__2.pdf
剩下基础的各种distribution expectation variance pdf是啥,如何运用,尤其n够大时候可以用standord normal去approximate各种计算。bayesian的题多看一看,k姐的贴也有材料。想到面到什么再补充

3.  ML
楼主最早上过Udacity的Intro课算启蒙,而后套路是面试中学习。曾经的想法重点在调包调参原理。. check 1point3acres for more.
总结:最近计划再详细复习unsupervised learning和cross validation的知识。老被问!如果问到底很可能被问死(面试官是可以很任性)。
借鉴一些同学的帖子,贴上两本书,islr+esl:
An intro to statistical learning with application in R(http://www-bcf.usc.edu/~gareth/ISL/ISLR%20First%20Printing.pdf)

Elements of statistical learning.(http://statweb.stanford.edu/~tibs/ElemStatLearn/

4. deep learning
不知道有没有时间。。刷一下这个课:http://cs231n.stanford.edu/
https://www.youtube.com/watch?v= ... MxFYRiNRS07MCWN5UIA

5. case问题:
需要提升。之前amazon买了神书:Lean-Analytics-Better-Startup-Faster,有时间再翻翻
银行,tech都问过,只能是说在面试中学习。总结接下来学习:. Χ
make assumption. ----
how to define metrics
feature enginnering/preprocessing
which model,如何optimize parameter
ab testing(dilution,network effect,subject granularity,randomization,sample size,MVT?)
求推荐补充ab testing 的course:

causal inference(causal graph, selection bias,propensity score match, Inverse probability weighting, instrumental,etc.)

面筋eg: given a e-commerce dataset, want to design ab testing, what to investigate in data?
没回答好。后来想了一下,如果increase conversion rate,但是这个transaction里面买的都是item price很小
那即使converted数量多但是total revenue可能还不如conversion rate低但是每个transcation买的商品单价都高。那么这个问题如何根据已有data分析出来应该选conversion 还是revenue/profit, 接下来怎么设计ab testing?

case的部分最后想对自己说:你清醒一点!刷ins,综艺的时间,还是多看看tech公司的blog吧。.--

6.sql
自己总结的题库,时不时的刷一下。 hackerrank的题做完两遍了,不知道sql最难会考到什么样??
目前为止都很不是问题

7. take home data challenge. ----
如果有时间刷一下kaggle再来补充了
借鉴很好的总结帖:http://www.1point3acres.com/bbs/thread-326201-1-1.html


draft先这么多,想到再补充。. 1point3acres.com
玄学归玄学,大师也说:需要给自身安排计划,且坚持执行。

希望和小伙伴相互鼓励监督!


. 1point3acres


. 1point 3 acres





. check 1point3acres for more.


. Waral dи,

补充内容 (2019-3-24 01:50):.
补充一下之前面试被问到的computer vision相关的题,概念和计算:IOU, precision, recall, F1 score, ROC curve cut-off, etc.
. From 1point 3acres bbs
补充内容 (2019-3-25 11:20):
ab testing入门篇:https://in.udacity.com/course/ab-testing--ud257
持续寻找or补充面筋
-baidu 1point3acres
补充内容 (2019-4-28 05:57):
根据最近面试,复习几点:
1. case study中predict customer churn/conversion rat,选取 training dataset的time bias问题如何解决?time series analysis 概念和应用?
2.PCA detect multicollinearity eigenvalue.1point3acres

补充内容 (2019-4-28 06:21):
补充一个链接,帮助准备product case
https://player.oreilly.com/videos/9781491953471

评分

参与人数 33大米 +60 收起 理由
一颗小布丁 + 1 给你点个赞!
Rosieqqan + 1 太有才了!
2tackle + 2 给你点个赞!
无语的艺术 + 1 给你点个赞!
healthydoer + 1 很有用的信息!

查看全部评分


上一篇:向收到Insight Fellowship offer的同学请教经验
下一篇:讨论一道常见的DS面试题
推荐
pika123 2022-1-21 05:20:15 | 只看该作者
全局:
楼主有的这些迷茫我都有,我是金融本科加上ds硕士,现在好不容易上岸找了一家小金融类公司的ds,有金融背景找金融领域的ds还是比较容易的。几大投行or银行,以及flag,除了亚麻不喜欢没投,其他的都面了,前者五花八门,偏重bq交流,我还没有楼主的communication ablility着实很累了。尤其大摩,搞不懂ds类岗位,面了一堆啥。互联网则是太难,当然相对大家都难,但是被面试追着走,我找了一年多工作真的是太累了。我估计工作定下来就开始刷题转码了....楼主or学姐决定了,我们可以一起转码....
回复

使用道具 举报

推荐
 楼主| yrq410_ 2019-4-28 06:11:52 | 只看该作者
全局:
回来打个卡,补充了几点面试遇到的问题。
回来打卡。最近的面试感想就是。。。即使onsite自我感觉发挥良好,依旧可能杯具,有点儿香菇。
.--
1. 继续一波刷题!。。。熟练还是很重要。 一般coding section还是遇cs出身的面试官。 时间复杂度,follow up都会考。 难度依旧是easy-medium
2. 作为Master, ds 岗位竞争力比起phd真的是输在起跑线上。这点就只能考多投多面,面试中学习比蒙头学习的ROI高不少
3. case study还是需要积累。往往问的都是公司里最近在做的项目和遇到的问题。 这点看看公司员工写的blog还是蛮有启示的。 但是没有遇到过的思考过的问题,如何展开,楼主也是不断陷入沉思。 毕竟hiring team 往往prefer不需要mentor,能够独当一面的ds,尤其是一些unicore类公司,或者大公司的小team。 这就是为什么他们更prefer phd。
.--
回复

使用道具 举报

🔗
haomafan 2019-3-24 02:14:31 | 只看该作者
全局:
请问楼主ds也要考算法题吗?一般什么难度?
回复

使用道具 举报

🔗
 楼主| yrq410_ 2019-3-24 02:26:31 | 只看该作者
全局:
haomafan 发表于 2019-3-24 02:14
请问楼主ds也要考算法题吗?一般什么难度?

哈哈是你呀. 1point 3acres
不会超med 大部分easy 算法不好会隔周忘  系统复习一下
回复

使用道具 举报

全局:
重码,想来我以后也是统计ms出身要步入ds的人,要老老实实的提前准备!楼主可以的话加个联系方式!
回复

使用道具 举报

🔗
missyumi 2019-3-24 04:11:28 | 只看该作者
全局:
很系统的内容 谢谢🙏
回复

使用道具 举报

🔗
shawnoliver 2019-3-24 07:32:17 | 只看该作者
全局:
很有用的信息!
回复

使用道具 举报

全局:
lz加油~ 学有所成!
回复

使用道具 举报

🔗
 楼主| yrq410_ 2019-3-25 11:15:34 | 只看该作者
全局:
mazexiaozhoulu 发表于 2019-3-24 02:42
重码,想来我以后也是统计ms出身要步入ds的人,要老老实实的提前准备!楼主可以的话加个联系方式!

好的可以私信
回复

使用道具 举报

🔗
 楼主| yrq410_ 2019-3-25 11:16:44 | 只看该作者
全局:
snow19951 发表于 2019-3-25 09:50
lz加油~ 学有所成!

说的好!坚持~~
回复

使用道具 举报

全局:

楼主!(LXZTVfXQ)你试试能不能加我~
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

>
快速回复 返回顶部 返回列表