《数据科学面试40+真题讲解》,K神本年度最后一次开课


一亩三分地论坛

 找回密码
 Sign Up 注册获取更多干货
码农求职神器Triplebyte:
不用海投,内推你去多家公司面试
Airbnb 数据科学职位
in analytics and inference
天天打游戏、照样领工资,
你要不要来?
把贵司招聘信息放这里
查看: 1656|回复: 18
收起左侧

DrawBridge manager二面

[复制链接] |试试Instant~ |关注本帖
jerry_lin324 发表于 2015-7-15 05:22:12 | 显示全部楼层 |阅读模式

2015(7-9月) 码农类 硕士 全职@Drawbridge - 网上海投 - 技术电面 |Otherfresh grad应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?Sign Up 注册获取更多干货

x
本人面的是software engineer(algorithm),刚才跟一个叫Xiang Li的lead engineer聊了一小时。
前四十分钟基本都是各种ML,怎么选model,为什么用这个model,然后把他们的一个正在做的问题的prototype告诉我,问我怎么处理feature。还有就是在matrix dimension非常大的时候怎么有效的做dimension reduction。(PCA的时候因为要算enginvector,所以matrix dimension很大的时候这个算起来效率很低,他就问如何improve)。前四十分钟自我感觉良好,接下来瞬间就跌入低谷。

接下来他就问我hadoop用的咋样,我就说入门级,他说那来一个题试试看。瞬间就有一种不祥的预感,其实问题也不难,关键是好久没搞过了。他主要问细节,比如说你怎么在reducer里面把input的key-value pair处理成想要的ouput形式。

题目就是用map-reduce找anagrams。欢迎大家来讨论~~~
.鐣欏璁哄潧-涓浜-涓夊垎鍦
估计没戏了。。。。


补充内容 (2015-7-15 07:26):
啊啊啊,刚面完过了四十分钟,居然说我过了这一轮,准备约Skype onsite了。

补充内容 (2015-7-16 08:46):
又不是Skype onsite了,还得有一轮才能去onsite,醉了

评分

2

查看全部评分

say543 发表于 2015-7-15 06:55:52 | 显示全部楼层
thanks for sharing.  so you are requested to come up with a runnable version? or just pseudo code?
回复 支持 反对

使用道具 举报

Cloris_Shi 发表于 2015-7-15 07:20:33 | 显示全部楼层
在你之后刚面完,同跪了,也是map-reduce anagrams 那个题目,对于Hadoop一点都不熟悉。
而且全程就只靠用嘴说,shared doc都没有,没有写code
回复 支持 反对

使用道具 举报

 楼主| jerry_lin324 发表于 2015-7-15 07:28:33 | 显示全部楼层
Cloris_Shi 发表于 2015-7-15 07:20
在你之后刚面完,同跪了,也是map-reduce anagrams 那个题目,对于Hadoop一点都不熟悉。
而且全程就只靠用 ...

我是还有点印象,就是边做边回忆吧。刚才已经接到预约Skype onsite的通知了
回复 支持 反对

使用道具 举报

Cloris_Shi 发表于 2015-7-15 08:16:15 | 显示全部楼层
jerry_lin324 发表于 2015-7-15 07:28. 1point3acres.com/bbs
我是还有点印象,就是边做边回忆吧。刚才已经接到预约Skype onsite的通知了

恭喜,LZ加油
回复 支持 反对

使用道具 举报

354886 发表于 2015-7-15 08:38:25 | 显示全部楼层
题目lz能讲一下吗,map-reduce找anagram?
回复 支持 反对

使用道具 举报

 楼主| jerry_lin324 发表于 2015-7-15 08:51:39 | 显示全部楼层
. 1point3acres.com/bbs
谢谢,看来是这几天疯狂发面经,人品来了
回复 支持 反对

使用道具 举报

 楼主| jerry_lin324 发表于 2015-7-15 08:56:29 | 显示全部楼层
354886 发表于 2015-7-15 08:38
题目lz能讲一下吗,map-reduce找anagram?

就是给你一个document,然后在里面找anagram words。我的思路是这样的:
Mapper:-google 1point3acres
input:(1,W1),(2,W2),....,(n,Wn),这个input的key-value pair就是最简单的那种mapping关系.
output: key-word,value-vector representation of word, vector是一个26维的,因为有26个英文字母嘛

Reducer:
Input: Key-vector,value-list of words has the same vector. 这样在这个list里面所有两两的words都是anagram了。
Output: Key-word1,value-word2

只是个简单思路,大神路过轻喷
回复 支持 反对

使用道具 举报

 楼主| jerry_lin324 发表于 2015-7-15 08:59:31 | 显示全部楼层
say543 发表于 2015-7-15 06:55
thanks for sharing.  so you are requested to come up with a runnable version? or just pseudo code?

just how to manipulate the key-value pair for both mapper and reducer
回复 支持 反对

使用道具 举报

xiaoc10 发表于 2015-7-15 13:12:08 | 显示全部楼层
楼主大好人呀!
回复 支持 反对

使用道具 举报

AndyLiu0429 发表于 2015-7-15 16:48:10 | 显示全部楼层
mapper的输出能不能是key:sorted string,(字母序拍好),value:original stirng。
鏉ユ簮涓浜.涓夊垎鍦拌鍧. shuffle的时候所有的anagram组就在一起了,然后reduce合并value-list就好了。
回复 支持 反对

使用道具 举报

MCwong 发表于 2015-7-15 16:51:32 | 显示全部楼层
关于MapReduce求anagrams,有一个疑问还请lz解答: 假设我最终得出的结果是wordA, wordB和wordC互为anagrams, 那么期望的reducer output是不是Key-wordA, Value-[wordB, wordC]
回复 支持 反对

使用道具 举报

 楼主| jerry_lin324 发表于 2015-7-15 23:31:08 | 显示全部楼层
AndyLiu0429 发表于 2015-7-15 16:48-google 1point3acres
mapper的输出能不能是key:sorted string,(字母序拍好),value:original stirng。
shuffle的时候所有 ...
. Waral 鍗氬鏈夋洿澶氭枃绔,
嗯啊,这样应该也可以。用vector的优点我是这么认为的:vector里面都是0/1,其实这个就很像Leetcode里面那个Excel Column title,你可以把这个vector转换成单一的值。这样当你用一部分数据建立好model,检验一个新的word的时候比较快。
回复 支持 反对

使用道具 举报

 楼主| jerry_lin324 发表于 2015-7-15 23:35:01 | 显示全部楼层
MCwong 发表于 2015-7-15 16:51
关于MapReduce求anagrams,有一个疑问还请lz解答: 假设我最终得出的结果是wordA, wordB和wordC互为anagrams, ...

嗯啊,这样应该也是可以的。
回复 支持 反对

使用道具 举报

say543 发表于 2015-7-16 01:09:02 | 显示全部楼层
my idea is the same 11 floor...
回复 支持 反对

使用道具 举报

头像被屏蔽
ndhuanhuan 发表于 2015-7-22 12:38:15 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

 楼主| jerry_lin324 发表于 2015-7-22 23:45:48 | 显示全部楼层
ndhuanhuan 发表于 2015-7-22 12:38
楼主, 求第三轮面经~ 多谢啦

本人以病,本来三面是这周三,现在取消了。等我康复了再约吧,等面完就来发面经。你什么时候面呢?
回复 支持 反对

使用道具 举报

头像被屏蔽
ndhuanhuan 发表于 2015-7-23 00:41:01 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

siranjoy119 发表于 2017-3-3 09:33:34 | 显示全部楼层
LZ能问一下matrix dimension非常大的时候怎么有效的做dimension reduction吗?因为PCA肯定不行,请问你是怎么答的呢?

谢谢LZ大牛了。。。
回复 支持 反对

使用道具 举报

本版积分规则

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2017-11-18 07:15

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表