一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 1809|回复: 42
收起左侧

LinkedIn ML track实习二面

[复制链接] |试试Instant~ |关注本帖
yeyelovenimo 发表于 2016-11-2 03:27:54 | 显示全部楼层 |阅读模式

2016(10-12月) 码农类 博士 实习@Linkedin - 猎头 - 技术电面 |Otherfresh grad应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
几分钟前刚面完,印度大哥英语全程听不懂......

第一部分--coding
. From 1point 3acres bbs
Input:
A method getRandom01Biased() that generates a random integer in [0, 1], where 0 is generated with probability p and 1 is generated with probability (1-p).鏈枃鍘熷垱鑷1point3acres璁哄潧
Output:
A method getRandom06Uniform() that generates a random integer in [0, 6] with uniform probability
. from: 1point3acres.com/bbs

follow up: a method getRandomUniform(int a, int b) that generates a random integer in [a, b) with uniform probability

第二部分--ML questions
logistic regression: objective function
ensemble methods: 主要是楼主简历上的,只调过包不记得detail了,完全没答出来
unsupervised learning: if we have emails and user profiles, how do we determine if an email is public or private? 主要是考察unsupervised learning,楼主唯一知道的就是k means,于是问k means的assumption是什么,怎么用在这个问题上,但面试官明显想要的不是k means

ML部分答得太差了,感觉要跪,教训是简历上的每种model都必须了如指掌啊.... visit 1point3acres.com for more.

一面面经在此:http://www.1point3acres.com/bbs/thread-207323-1-1.html
. more info on 1point3acres.com




评分

3

查看全部评分

 楼主| yeyelovenimo 发表于 2016-11-2 03:32:21 | 显示全部楼层
顺便把coding的代码贴出来

private int getUniform() {
    while (true) {. From 1point 3acres bbs
        int randNum1 = getRandom01Biased();
        int randNum2 = getRandom01Biased();
        if (randNum1 == 0 && randNum2 == 1) {
            return 0;
        } else if (randNum1 == 1 && randNum2 == 0) {
            return 1;
        }
    }
}
// (p^2 + (1 - p)^2)^(m - 1) * 2 * p * (1 - p) ---probability of m iterations

public int getRandom06Uniform() {
    while (true) {
        int randDigit1 = getUniform();
        int randDigit2 = getUniform();
        int randDigit3 = getUniform();
        int result = (randDigit1 << 2) + (randDigit2 << 1) + randDigit3;
        if (result != 7) {
            return result;
        } . visit 1point3acres.com for more.
    }
}. from: 1point3acres.com/bbs
// generate a random integer in [a, b) with uniform probability
// numDigits  = ceiling(log_2(1000,000))
public int getRandomUniform(int a, int b) {
    int range = b - a;
    int numDigits = 1;
    int i = 0;
    while (range < (numDigits << i)) {
        i++;
    }
    while (true) {
       int result = 0;  
       for (int j = 0; j < i; j++) {
           result += (getUniform() << j);
       }-google 1point3acres
       if (result < b - a) { 鏉ユ簮涓浜.涓夊垎鍦拌鍧.
           return a + result;
       }
    }  
}
回复 支持 2 反对 0

使用道具 举报

 楼主| yeyelovenimo 发表于 2016-11-7 10:35:32 | 显示全部楼层
gyzjay 发表于 2016-11-6 10:24
恭喜恭喜,是进pool了?

对的,之后应该要match组了
回复 支持 1 反对 0

使用道具 举报

cookielee77 发表于 2016-11-2 04:08:09 | 显示全部楼层
楼主是CS的还是stat?
回复 支持 反对

使用道具 举报

 楼主| yeyelovenimo 发表于 2016-11-2 04:16:04 | 显示全部楼层
cookielee77 发表于 2016-11-2 04:08
楼主是CS的还是stat?

都不是,我OR的
回复 支持 反对

使用道具 举报

lyoaix 发表于 2016-11-2 04:34:32 | 显示全部楼层
那个一定要unsupervised么。。。感觉就是个binary classification的问题啊
回复 支持 反对

使用道具 举报

 楼主| yeyelovenimo 发表于 2016-11-2 05:09:11 | 显示全部楼层
lyoaix 发表于 2016-11-2 04:34
那个一定要unsupervised么。。。感觉就是个binary classification的问题啊

training data is unlabeled
回复 支持 反对

使用道具 举报

yaozhengkun110 发表于 2016-11-2 13:36:38 | 显示全部楼层
楼主面的第一题没有在面经里出现过,长见识了,希望我不会遇到没遇到的题。。。。
回复 支持 反对

使用道具 举报

superddt 发表于 2016-11-2 13:39:15 | 显示全部楼层
我猜面试官第二题是不是想问Latent Dirichlet Allocation啊?find topics in text.
回复 支持 反对

使用道具 举报

say543 发表于 2016-11-2 14:37:29 | 显示全部楼层
yeyelovenimo 发表于 2016-11-2 03:32
顺便把coding的代码贴出来. from: 1point3acres.com/bbs

private int getUniform() {


楼主 第一题的follow up 不让用额外的space是嘛?
回复 支持 反对

使用道具 举报

say543 发表于 2016-11-2 14:39:06 | 显示全部楼层
yeyelovenimo 发表于 2016-11-2 03:32
.鐣欏璁哄潧-涓浜-涓夊垎鍦顺便把coding的代码贴出来

private int getUniform() {


楼主 第一题的follow up 不让用额外的space是嘛?
回复 支持 反对

使用道具 举报

 楼主| yeyelovenimo 发表于 2016-11-3 00:38:15 | 显示全部楼层
yaozhengkun110 发表于 2016-11-2 13:36. visit 1point3acres.com for more.
楼主面的第一题没有在面经里出现过,长见识了,希望我不会遇到没遇到的题。。。。

据说LinkedIn tag里的42道题还是蛮准的,就是我两轮都没有遇到......加油!
回复 支持 反对

使用道具 举报

 楼主| yeyelovenimo 发表于 2016-11-3 00:40:37 | 显示全部楼层
superddt 发表于 2016-11-2 13:39. visit 1point3acres.com for more.
我猜面试官第二题是不是想问Latent Dirichlet Allocation啊?find topics in text.

不是,只有user profiles包括name, gender, age, education, work等基本信息,没有access to emails
回复 支持 反对

使用道具 举报

 楼主| yeyelovenimo 发表于 2016-11-3 00:41:46 | 显示全部楼层
say543 发表于 2016-11-2 14:37
楼主 第一题的follow up 不让用额外的space是嘛?

对,本来刚new了个array, 面试官就问能不能不用,不过也不太影响代码
回复 支持 反对

使用道具 举报

gyzjay 发表于 2016-11-3 06:22:00 | 显示全部楼层
想问一下,关键是我就算无监督学习了,在EVAL 和test上我怎么确定我的分类属于哪一类? 这个应该是和楼主的简历项目有关?
有在这一题上比K means更好的无监督么?
回复 支持 反对

使用道具 举报

 楼主| yeyelovenimo 发表于 2016-11-3 06:37:35 | 显示全部楼层
gyzjay 发表于 2016-11-3 06:22
想问一下,关键是我就算无监督学习了,在EVAL 和test上我怎么确定我的分类属于哪一类? 这个应该是和楼主的 ...

简历上木有任何unsupervised learning相关的项目......只在ml课上学过k means,所以就跟他乱扯用weighted user features做clustering,说得自己都觉得不太对......然后再跟他扯很intuitive的方法,首先group users by email domains,然后只要判断每个group对应的email domain是public还是private。可以看每个group里user的相似度,比如如果这个group的所有user都在一个公司,probably这个domain是这个公司的domain,所以是private的,总之一直在乱扯......
回复 支持 反对

使用道具 举报

gyzjay 发表于 2016-11-3 06:46:18 | 显示全部楼层
yeyelovenimo 发表于 2016-11-3 06:37
简历上木有任何unsupervised learning相关的项目......只在ml课上学过k means,所以就跟他乱扯用weighted ...

但是就算我这么做,也无法用于EVALUATION 啊这样完全是用domain knowledge在做。。。。。
回复 支持 反对

使用道具 举报

gyzjay 发表于 2016-11-3 06:47:09 | 显示全部楼层
gyzjay 发表于 2016-11-3 06:46
但是就算我这么做,也无法用于EVALUATION 啊这样完全是用domain knowledge在做。。。。。

你判断是公司的domain相当于还是supervised?
回复 支持 反对

使用道具 举报

gyzjay 发表于 2016-11-3 07:28:18 | 显示全部楼层
可以问问楼主ensemble learning是什么问题么?. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
问的ensemble有哪些方法?效果是如何?
回复 支持 反对

使用道具 举报

 楼主| yeyelovenimo 发表于 2016-11-3 10:26:35 | 显示全部楼层
gyzjay 发表于 2016-11-3 06:47
你判断是公司的domain相当于还是supervised?

反正他就一直强调没有label,所以应该只要把private和public分开即可,再用domain knowledge judge一下每类是private还是public吧
回复 支持 反对

使用道具 举报

 楼主| yeyelovenimo 发表于 2016-11-3 10:27:39 | 显示全部楼层
gyzjay 发表于 2016-11-3 07:28
可以问问楼主ensemble learning是什么问题么?. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
问的ensemble有哪些方法?效果是如何?

就让大概介绍一下,估计是我简历上的几个冷门model他没见过好奇一下
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-7 21:20

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表