《数据科学面试40+真题讲解》,K神本年度最后一次开课


一亩三分地论坛

 找回密码
 Sign Up 注册获取更多干货
码农求职神器Triplebyte:
不用海投,内推你去多家公司面试
Airbnb 数据科学职位
in analytics and inference
天天打游戏、照样领工资,
你要不要来?
把贵司招聘信息放这里
查看: 6972|回复: 2
收起左侧

Rocket Fuel OA+电面+onsite

[复制链接] |试试Instant~ |关注本帖
zhaishaodan 发表于 2015-10-1 07:20:14 | 显示全部楼层 |阅读模式

2015(7-9月) 码农类 博士 全职@Rocket Fuel - 内推 - 技术电面 Onsite 在线笔试 |Passfresh grad应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?Sign Up 注册获取更多干货

x
面的是machine learning组,software engineer - machine learning职位。但这个组里还有一些数学背景的phd,感觉这个职位更像data scientist。
. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
组里大多是中国人,都很nice,很推荐这个组!
不过RF确实现在不行了,起初给的offer和其他offer差5,6万的样子,match了过后还是差3,4万。
. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
先是OA,Spaceship Scorer, 就是赛车那道题。看mitbbs上用线段树做,觉得应该整点新花样,于是用binary indexed tree来做。果然还是有效果的,后来电面的时候面试官说我看你OA的code写的很好就不问coding了,然后那轮电面20分钟不到结束。。。
这是当时写的code:
  1. #include <iostream>
  2. #include <vector>
  3. #include <algorithm>
  4. #include <unordered_map>
  5. using namespace std;

  6. struct TimeInfo{
  7.     TimeInfo(long long time, bool isStart, int sid) : time(time), isStart(isStart), sid(sid){}. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
  8.     long long time;
  9.     bool isStart;
  10.     int sid;
  11. };

  12. bool compTimeInfo(const TimeInfo& t1, const TimeInfo& t2){
  13.     return t1.time < t2.time;
  14. }. visit 1point3acres.com for more.
  15. .1point3acres缃
  16. bool compScoreSid(pair<int, int> p1, pair<int, int> p2){
  17.     if(p1.first == p2.first) return p1.second < p2.second;
  18.     return p1.first < p2.first;
  19. }

  20. // binary indexed tree
  21. class BITree{. more info on 1point3acres.com
  22. public:
  23.     BITree(int n) : data(n+1, 0){}
  24.     // get sum of data[i...j]
  25.     int getSum(int i, int j){. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
  26.         if(i > 0) return getSum(j) - getSum(i-1);
  27.         return getSum(j);
  28.     }
  29.     // update data[i] to data[i]+1
  30.     void addOne(int i){
  31.         int ix = i+1;
  32.         while(ix < data.size()){
  33.             data[ix]++;
  34.             ix += (ix&(-ix));
  35.         }. 1point 3acres 璁哄潧
  36.     }
  37. private:. 1point 3acres 璁哄潧
  38.     // get sum of data[0...i]
  39.     int getSum(int i){
  40.         int ix = i+1;
  41.         int sum = 0;
  42.         while(ix > 0){. visit 1point3acres.com for more.
  43.             sum += data[ix];. more info on 1point3acres.com
  44.             ix -= (ix&(-ix));
  45.         }
  46.         return sum;
  47.     }
  48.     vector<int> data;
  49. };
  50. 鏉ユ簮涓浜.涓夊垎鍦拌鍧.
  51. int main() {
  52.     /* Enter your code here. Read input from STDIN. Print output to STDOUT */
  53.     int n;
  54.     cin >> n;
  55.     vector<TimeInfo> timeinfos(2*n, TimeInfo(0,false,0)); // (time, start/end, spaceshipId) records. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
  56.     int sid;
  57.     long long starttime, endtime;
  58.     for(int i = 0; i < n; i++){
  59.         cin >> sid;
  60.         cin >> starttime;. from: 1point3acres.com/bbs
  61.         cin >> endtime;
  62.         timeinfos[2*i] = TimeInfo(starttime, true, sid);. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
  63.         timeinfos[2*i+1] = TimeInfo(endtime, false, sid);
  64.     }
  65.     sort(timeinfos.begin(), timeinfos.end(), compTimeInfo);. 鍥磋鎴戜滑@1point 3 acres
  66.    
  67.     unordered_map<int, int> sid2startTime; // maps spaceshipId to start time index in timeinfos. visit 1point3acres.com for more.
  68.     BITree bit(2*n); // use binary indexed tree for range sum query
  69.     vector<pair<int, int>> score_sid; // (score, spaceshipId) pairs. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
  70.     score_sid.reserve(n);
  71.     for(int i = 0; i < timeinfos.size(); i++){. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
  72.         if(timeinfos[i].isStart){
  73.             sid2startTime[timeinfos[i].sid] = i;
  74.         } else {
  75.             int startIx = sid2startTime[timeinfos[i].sid];
  76.             int score = bit.getSum(startIx, i);
  77.             score_sid.push_back(make_pair(score, timeinfos[i].sid));
  78.             bit.addOne(startIx);
  79.         }
  80.     }. 1point 3acres 璁哄潧
  81.    
  82.     sort(score_sid.begin(), score_sid.end(), compScoreSid);
  83.     for(int i = 0; i < n; i++){. Waral 鍗氬鏈夋洿澶氭枃绔,
  84.         cout<<score_sid[i].second<<" "<<score_sid[i].first<<endl;
  85.     }
  86.     return 0;. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
  87. }
复制代码
电面1,概率题。.鏈枃鍘熷垱鑷1point3acres璁哄潧
A drunk man wakes up at the North-westedge of a city. He must find his way home, but unfortunately, he only knowsthat it is South or East of his current location. He is in a city with 100 x100 blocks. His current location is (0,0), and his home is at (78, 81). Herecognizes his home, so once he is at block (78, 81), he is safe.
0,0 -- 1,0 -- 2,0 -- 3,0 -- … 78,0 -- … --100,0
|        |       |
0,1 -- 1,1 -- 2,1
|        |       |
0,2 -- 1,2 -- …
|        |
|
0,81 -- …                         78,81-- …
|
|
0,100 -- …                                           100,100

  • If the man has 60% chance     of moving East at every intersection, and 40% chance of moving South at     every intersection, what is the probability that he will make it home?. Waral 鍗氬鏈夋洿澶氭枃绔,
         
    答:choose(78, 78+81) * p(R)^78 * P(D)^81
         . 鍥磋鎴戜滑@1point 3 acres
         
         
         

  • If the man can backtrack one block any time he     moves forward one block (if he moves south one block, he can move north     one block and end up where he started. He would have walked 2 blocks     total.). How can you minimize the expected number of blocks he walks to     get home?
不知道。然后简化了一下问题,问做到(1,0)的期望是多少。.鏈枃鍘熷垱鑷1point3acres璁哄潧
. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
答:E = 1*p(R) + (2+E)*p(D)  =>E=7/3


电面2
改错题。
概率题:一个拍卖理论的题目。如果拍卖的时候出价最高的人得到商品,但是付出的价格是出价第二高的价格。比如A, B, C三个人分别出了10, 9, 8,那么A将花9元钱得到拍卖品。. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
问题是,如果一个商品价值10元,应该给出什么价最优?
答:出10元,因为一旦你得到拍卖品,最多是花9元获得的,赚了1元。。。。这题有点脑残。。. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷

onsite:. visit 1point3acres.com for more.
1, 讲自己的research. From 1point 3acres bbs

2,写了个quick select. more info on 1point3acres.com

3,就这轮不是国人,果然难度急剧上升。还是数学PHD
3.1 linear regression中,feature之间colinear问题怎么解决。
答:用PCA或者VIF
follow up: 以上方法不适用的时候怎么办
答:用regularization。比如用L2 regularization,LR就能求出封闭解了。然后现场把封闭解推了一遍。
3.2 logistic regression的目标函数
答:从最大似然估计讲起,把表达式写出来。
3.3 SVM为什么解dual form
答:主要是kernel trick
3.4 overfitting现象以及避免的方法. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
3.5 2sum
3.6 LC jump II


4, 又是数学PHD。。。
4.1 random shuffle 以及 reservoir Sampling。
4.2 mapreduce top k
4.3 其他一些问题忘了。。。


.鏈枃鍘熷垱鑷1point3acres璁哄潧






评分

1

查看全部评分

beiye_pitt 发表于 2015-10-19 08:15:24 | 显示全部楼层
我也投了这个职位,刚开始,马上做OA。祝你好运!
回复 支持 反对

使用道具 举报

elizabethxiazhi 发表于 2016-10-7 07:47:08 | 显示全部楼层
求问LZ还记得两轮店面过后多久有消息的嘛?面完两天了
回复 支持 反对

使用道具 举报

本版积分规则

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2017-11-20 02:15

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表