近期论坛无法登录的解决方案


一亩三分地论坛

 找回密码
 获取更多干活,快来注册

一亩三分地官方iOS手机应用下载
查看: 5659|回复: 43
收起左侧

LinkedIn ML track实习二面

[复制链接] |试试Instant~ |关注本帖
yeyelovenimo 发表于 2016-11-2 03:27:54 | 显示全部楼层 |阅读模式

2016(10-12月) 码农类 博士 实习@Linkedin - 猎头 - 技术电面 |Otherfresh grad应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干活,快来注册

x
几分钟前刚面完,印度大哥英语全程听不懂......

第一部分--coding

Input:. 1point3acres.com/bbs
A method getRandom01Biased() that generates a random integer in [0, 1], where 0 is generated with probability p and 1 is generated with probability (1-p)
Output:
A method getRandom06Uniform() that generates a random integer in [0, 6] with uniform probability


follow up: a method getRandomUniform(int a, int b) that generates a random integer in [a, b) with uniform probability. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴

第二部分--ML questions
logistic regression: objective function
ensemble methods: 主要是楼主简历上的,只调过包不记得detail了,完全没答出来
unsupervised learning: if we have emails and user profiles, how do we determine if an email is public or private? 主要是考察unsupervised learning,楼主唯一知道的就是k means,于是问k means的assumption是什么,怎么用在这个问题上,但面试官明显想要的不是k means. From 1point 3acres bbs

ML部分答得太差了,感觉要跪,教训是简历上的每种model都必须了如指掌啊...

一面面经在此:http://www.1point3acres.com/bbs/thread-207323-1-1.html





评分

3

查看全部评分

 楼主| yeyelovenimo 发表于 2016-11-2 03:32:21 | 显示全部楼层
关注一亩三分地公众号:
Warald_一亩三分地
顺便把coding的代码贴出来. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴

private int getUniform() {
    while (true) {
        int randNum1 = getRandom01Biased();
        int randNum2 = getRandom01Biased();
        if (randNum1 == 0 && randNum2 == 1) {
            return 0;
        } else if (randNum1 == 1 && randNum2 == 0) {
            return 1;
        }. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
    }
}
// (p^2 + (1 - p)^2)^(m - 1) * 2 * p * (1 - p) ---probability of m iterations-google 1point3acres

public int getRandom06Uniform() {
    while (true) {
        int randDigit1 = getUniform();
        int randDigit2 = getUniform();
        int randDigit3 = getUniform();
        int result = (randDigit1 << 2) + (randDigit2 << 1) + randDigit3;
        if (result != 7) {. From 1point 3acres bbs
            return result;
        }
    }
}
// generate a random integer in [a, b) with uniform probability
// numDigits  = ceiling(log_2(1000,000))
public int getRandomUniform(int a, int b) {
    int range = b - a;
    int numDigits = 1;. 1point 3acres 璁哄潧
    int i = 0;
    while (range < (numDigits << i)) {. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
        i++;
    }
    while (true) {
       int result = 0;  
       for (int j = 0; j < i; j++) {
           result += (getUniform() << j);
       }
       if (result < b - a) {
           return a + result;
       }
    }  
}
回复 支持 2 反对 0

使用道具 举报

 楼主| yeyelovenimo 发表于 2016-11-7 10:35:32 | 显示全部楼层
关注一亩三分地微博:
Warald
gyzjay 发表于 2016-11-6 10:24. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
恭喜恭喜,是进pool了?

对的,之后应该要match组了
回复 支持 1 反对 0

使用道具 举报

cookielee77 发表于 2016-11-2 04:08:09 | 显示全部楼层
楼主是CS的还是stat?
回复 支持 反对

使用道具 举报

 楼主| yeyelovenimo 发表于 2016-11-2 04:16:04 | 显示全部楼层
cookielee77 发表于 2016-11-2 04:08
楼主是CS的还是stat?

都不是,我OR的
回复 支持 反对

使用道具 举报

lyoaix 发表于 2016-11-2 04:34:32 | 显示全部楼层
那个一定要unsupervised么。。。感觉就是个binary classification的问题啊
回复 支持 反对

使用道具 举报

 楼主| yeyelovenimo 发表于 2016-11-2 05:09:11 | 显示全部楼层
lyoaix 发表于 2016-11-2 04:34. from: 1point3acres.com/bbs
那个一定要unsupervised么。。。感觉就是个binary classification的问题啊

training data is unlabeled
回复 支持 反对

使用道具 举报

yaozhengkun110 发表于 2016-11-2 13:36:38 | 显示全部楼层
楼主面的第一题没有在面经里出现过,长见识了,希望我不会遇到没遇到的题。。。。
回复 支持 反对

使用道具 举报

superddt 发表于 2016-11-2 13:39:15 | 显示全部楼层
我猜面试官第二题是不是想问Latent Dirichlet Allocation啊?find topics in text.
回复 支持 反对

使用道具 举报

say543 发表于 2016-11-2 14:37:29 | 显示全部楼层
yeyelovenimo 发表于 2016-11-2 03:32
顺便把coding的代码贴出来

private int getUniform() {

. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
楼主 第一题的follow up 不让用额外的space是嘛?
回复 支持 反对

使用道具 举报

say543 发表于 2016-11-2 14:39:06 | 显示全部楼层
yeyelovenimo 发表于 2016-11-2 03:32
顺便把coding的代码贴出来

private int getUniform() {

. from: 1point3acres.com/bbs
楼主 第一题的follow up 不让用额外的space是嘛?
回复 支持 反对

使用道具 举报

 楼主| yeyelovenimo 发表于 2016-11-3 00:38:15 | 显示全部楼层
yaozhengkun110 发表于 2016-11-2 13:36
楼主面的第一题没有在面经里出现过,长见识了,希望我不会遇到没遇到的题。。。。

据说LinkedIn tag里的42道题还是蛮准的,就是我两轮都没有遇到......加油!
回复 支持 反对

使用道具 举报

 楼主| yeyelovenimo 发表于 2016-11-3 00:40:37 | 显示全部楼层
superddt 发表于 2016-11-2 13:39
我猜面试官第二题是不是想问Latent Dirichlet Allocation啊?find topics in text.

不是,只有user profiles包括name, gender, age, education, work等基本信息,没有access to emails
回复 支持 反对

使用道具 举报

 楼主| yeyelovenimo 发表于 2016-11-3 00:41:46 | 显示全部楼层
say543 发表于 2016-11-2 14:37
楼主 第一题的follow up 不让用额外的space是嘛?

对,本来刚new了个array, 面试官就问能不能不用,不过也不太影响代码
回复 支持 反对

使用道具 举报

gyzjay 发表于 2016-11-3 06:22:00 | 显示全部楼层
想问一下,关键是我就算无监督学习了,在EVAL 和test上我怎么确定我的分类属于哪一类? 这个应该是和楼主的简历项目有关?
有在这一题上比K means更好的无监督么?.鐣欏璁哄潧-涓浜-涓夊垎鍦
回复 支持 反对

使用道具 举报

 楼主| yeyelovenimo 发表于 2016-11-3 06:37:35 | 显示全部楼层
gyzjay 发表于 2016-11-3 06:22
想问一下,关键是我就算无监督学习了,在EVAL 和test上我怎么确定我的分类属于哪一类? 这个应该是和楼主的 ...
. 鍥磋鎴戜滑@1point 3 acres
简历上木有任何unsupervised learning相关的项目......只在ml课上学过k means,所以就跟他乱扯用weighted user features做clustering,说得自己都觉得不太对......然后再跟他扯很intuitive的方法,首先group users by email domains,然后只要判断每个group对应的email domain是public还是private。可以看每个group里user的相似度,比如如果这个group的所有user都在一个公司,probably这个domain是这个公司的domain,所以是private的,总之一直在乱扯......
回复 支持 反对

使用道具 举报

gyzjay 发表于 2016-11-3 06:46:18 | 显示全部楼层
yeyelovenimo 发表于 2016-11-3 06:37-google 1point3acres
简历上木有任何unsupervised learning相关的项目......只在ml课上学过k means,所以就跟他乱扯用weighted ...

但是就算我这么做,也无法用于EVALUATION 啊这样完全是用domain knowledge在做。。。。。
回复 支持 反对

使用道具 举报

gyzjay 发表于 2016-11-3 06:47:09 | 显示全部楼层
gyzjay 发表于 2016-11-3 06:46 鏉ユ簮涓浜.涓夊垎鍦拌鍧.
但是就算我这么做,也无法用于EVALUATION 啊这样完全是用domain knowledge在做。。。。。

你判断是公司的domain相当于还是supervised?
回复 支持 反对

使用道具 举报

gyzjay 发表于 2016-11-3 07:28:18 | 显示全部楼层
可以问问楼主ensemble learning是什么问题么?
问的ensemble有哪些方法?效果是如何?
回复 支持 反对

使用道具 举报

 楼主| yeyelovenimo 发表于 2016-11-3 10:26:35 | 显示全部楼层
gyzjay 发表于 2016-11-3 06:47
你判断是公司的domain相当于还是supervised?

反正他就一直强调没有label,所以应该只要把private和public分开即可,再用domain knowledge judge一下每类是private还是public吧
回复 支持 反对

使用道具 举报

 楼主| yeyelovenimo 发表于 2016-11-3 10:27:39 | 显示全部楼层
gyzjay 发表于 2016-11-3 07:28
可以问问楼主ensemble learning是什么问题么?
问的ensemble有哪些方法?效果是如何?

就让大概介绍一下,估计是我简历上的几个冷门model他没见过好奇一下
回复 支持 反对

使用道具 举报

本版积分规则

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2017-6-29 22:36

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表