一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 1340|回复: 12
收起左侧

领英电面

[复制链接] |试试Instant~ |关注本帖
yular 发表于 2016-8-10 11:14:27 | 显示全部楼层 |阅读模式

2016(7-9月) 码农类 硕士 全职@Linkedin - Other - 技术电面 |Other在职跳槽

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
这次电面是HR自己找上门的,领英上直接联系我,去的组是搞云计算和机器学习的,就是所谓的大数据机器学习吧,很热门最近。电面长达一个多小时,估计应该挂了(原因看了问的的题目就知道)。面试官是个老外,口音听起来是三哥,但这次绝对没有黑我的意思,假如是我的话,我也可能会出类似的面试题。

首先是HR联系,问兴趣和聊经验,然后提供几个组给我选。HR面一般都很轻松,不要乱吹就好,实事求是。最后安排我去机器学习的组,但我已经一年多没摸过机器学习的东西,工作也是Hadoop相关,准备的时候没经验且有点松懈,导致了悲剧吧。

第一轮是电面,长达一小时,一个面试官,一个shadow,用collabedit写代码。URL在面试时才被告之。

首先是聊项目经验,大概15分钟左右,这部分面试官是很满意的,说很match。

然后是算法面试。给出N个人和他们在一维坐标的位置,求出一个位置,使得从这个位置出发到N个人的位置的距离总和最小。答案很简单,就是求出中位数,但当时有点呆了,不敢相信这么简单,而且也怕被问证明,所以最后靠面试官提示得出答案,最后用sort解出。完了一个follow up,有没有比直接用sort更快的方法,也是一时没想到,答案是老掉牙的:order statistic (O(n))。但总体还行。

最后是长达将近四十多分钟的,我当时万万没想到的,面机器学习各种概念和算法。以我很浅薄的经验,以为就像当年实习那样答几个概念就好,但这次不一样:
1.什么是 binary classifier

2.挑你最熟的binary classifier说一下,我选了神经网络. 1point3acres.com/bbs

3.写出sigmoid函数

4.有哪些参数可以调(alpha和lambda),追问:它们分别有什么用

5.写出cost function

6.写出backpropagation function

7.写出gradient function

8.weights and bias的概念. more info on 1point3acres.com

9.overfitting的概念

10.神经网络有哪些setting(我答得是调整node的数目和layer的数目)

12.问我写机器学习时是用lib还是自己动手(我说都有,lib用得多一点(其实就只有作业被老师逼才自己写。。。)). 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴

如果有机器学习大神路过求提供答案给过来看的人,我实在惭愧就不好意思贴了。。。

评分

1

查看全部评分

hxtang 发表于 2016-8-10 21:42:55 | 显示全部楼层
10.神经网络有哪些setting(我答得是调整node的数目和layer的数目)
这个你答得太简单了,神经网络的setting远多于这个。
.鏈枃鍘熷垱鑷1point3acres璁哄潧
神经网络的configuration本身除了layer数和node数,还有别的参数:
每个node的activation function可以有很多选择,以前流行的是sigmoid,现在流行的是rectified linear,其实linear的、纯binary也有,特别重要的是多类分类问题最后一层经常是softmax。
另外连接方式有很多种,default的是全连接,前两年流行convolutional,最近还流行recurrent neural network什么的.鐣欏璁哄潧-涓浜-涓夊垎鍦

如果说training算法选择就更多了。首先算法supervised或者unsupervised都有。BP是比较经典的supervised算法,但有些像restricted boltzman machine / deep belief network就是用contrast divergence来做unsupervised learning的。
像BP这样gradient descendant的,可以选是所有training sample一起学还是stocastic gradient descendant那样分batch,update网络的时候怎么选step, momentum,怎么判断收敛...
另外可以扯扯dropout什么的...



评分

1

查看全部评分

回复 支持 1 反对 0

使用道具 举报

 楼主| yular 发表于 2016-8-10 11:17:57 | 显示全部楼层
补充一个问题,算法那里还问如果是大数据过来请求那个求中位数的方法(function),怎么办?
回复 支持 反对

使用道具 举报

xnature 发表于 2016-8-10 11:26:41 | 显示全部楼层
yular 发表于 2016-8-10 11:17
补充一个问题,算法那里还问如果是大数据过来请求那个求中位数的方法(function),怎么办?

leetcode 295?
回复 支持 反对

使用道具 举报

say543 发表于 2016-8-10 13:03:13 | 显示全部楼层
LZ 说的order static 是quick selection的意思吗? 这个machine learning 的题目真的经典 没好好准备八成答不出来...
回复 支持 反对

使用道具 举报

bradybw 发表于 2016-8-10 14:47:54 | 显示全部楼层
感谢你的分享。请问楼主知道领英和微软共享冷冻期吗?
回复 支持 反对

使用道具 举报

 楼主| yular 发表于 2016-8-10 14:49:54 | 显示全部楼层
bradybw 发表于 2016-8-10 14:47
感谢你的分享。请问楼主知道领英和微软共享冷冻期吗?

应该不会,管理上两家公司分开的,微软只是为了抢互联网流量而已,不能被谷歌fb甩太远
回复 支持 反对

使用道具 举报

zj45499 发表于 2016-8-10 14:50:58 | 显示全部楼层
听起来是machine learning algo组?
回复 支持 反对

使用道具 举报

kayv 发表于 2016-8-10 19:39:22 | 显示全部楼层
.鏈枃鍘熷垱鑷1point3acres璁哄潧
大数据的话应该写map reduce程序了
回复 支持 反对

使用道具 举报

MulinZz 发表于 2016-8-10 20:53:42 | 显示全部楼层
牛逼,可以问一下您什么大概背景嘛。。
回复 支持 反对

使用道具 举报

hxtang 发表于 2016-8-10 22:22:51 | 显示全部楼层
yular 发表于 2016-8-10 11:17
补充一个问题,算法那里还问如果是大数据过来请求那个求中位数的方法(function),怎么办?

可能大数据还是sort比较好?有一个bitonic sorting network算法是O(log^2n)的并行算法。
median of median里面的recursive call应该很多并行系统是不支持的,而且里面好几个if condition也不利于并行性能。
回复 支持 反对

使用道具 举报

n0thing233 发表于 2016-8-10 23:05:29 | 显示全部楼层
看了下题目,问的都是很正统的机器学习的问题。好好准备的话应该没有问题的。
回复 支持 反对

使用道具 举报

zpinthehouse 发表于 2016-8-11 00:03:42 | 显示全部楼层
yular 发表于 2016-8-10 11:17
补充一个问题,算法那里还问如果是大数据过来请求那个求中位数的方法(function),怎么办?
. from: 1point3acres.com/bbs
data stream? 好像leetcode上有,一个minheap一个maxheap。。
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-11 02:43

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表