推荐:数据科学课程和书籍清单以及培训讲座


一亩三分地论坛

 找回密码
 获取更多干活,快来注册

一亩三分地官方iOS手机应用下载
查看: 1482|回复: 18
收起左侧

DrawBridge manager二面

[复制链接] |试试Instant~ |关注本帖
jerry_lin324 发表于 2015-7-15 05:22:12 | 显示全部楼层 |阅读模式

2015(7-9月) 码农类 硕士 全职@Drawbridge - 网上海投 - 技术电面 |Otherfresh grad应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干活,快来注册

x
本人面的是software engineer(algorithm),刚才跟一个叫Xiang Li的lead engineer聊了一小时。. 1point 3acres 璁哄潧
前四十分钟基本都是各种ML,怎么选model,为什么用这个model,然后把他们的一个正在做的问题的prototype告诉我,问我怎么处理feature。还有就是在matrix dimension非常大的时候怎么有效的做dimension reduction。(PCA的时候因为要算enginvector,所以matrix dimension很大的时候这个算起来效率很低,他就问如何improve)。前四十分钟自我感觉良好,接下来瞬间就跌入低谷。.鐣欏璁哄潧-涓浜-涓夊垎鍦

接下来他就问我hadoop用的咋样,我就说入门级,他说那来一个题试试看。瞬间就有一种不祥的预感,其实问题也不难,关键是好久没搞过了。他主要问细节,比如说你怎么在reducer里面把input的key-value pair处理成想要的ouput形式。

题目就是用map-reduce找anagrams。欢迎大家来讨论~~~

估计没戏了。。。。. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷

. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
补充内容 (2015-7-15 07:26):.鐣欏璁哄潧-涓浜-涓夊垎鍦
啊啊啊,刚面完过了四十分钟,居然说我过了这一轮,准备约Skype onsite了。
. From 1point 3acres bbs
补充内容 (2015-7-16 08:46):
又不是Skype onsite了,还得有一轮才能去onsite,醉了

评分

2

查看全部评分

say543 发表于 2015-7-15 06:55:52 | 显示全部楼层
关注一亩三分地公众号:
Warald_一亩三分地
thanks for sharing.  so you are requested to come up with a runnable version? or just pseudo code?
回复 支持 反对

使用道具 举报

Cloris_Shi 发表于 2015-7-15 07:20:33 | 显示全部楼层
关注一亩三分地微博:
Warald
在你之后刚面完,同跪了,也是map-reduce anagrams 那个题目,对于Hadoop一点都不熟悉。
而且全程就只靠用嘴说,shared doc都没有,没有写code
回复 支持 反对

使用道具 举报

 楼主| jerry_lin324 发表于 2015-7-15 07:28:33 | 显示全部楼层
Cloris_Shi 发表于 2015-7-15 07:20
在你之后刚面完,同跪了,也是map-reduce anagrams 那个题目,对于Hadoop一点都不熟悉。
而且全程就只靠用 ...

我是还有点印象,就是边做边回忆吧。刚才已经接到预约Skype onsite的通知了
回复 支持 反对

使用道具 举报

Cloris_Shi 发表于 2015-7-15 08:16:15 | 显示全部楼层
jerry_lin324 发表于 2015-7-15 07:28
鏉ユ簮涓浜.涓夊垎鍦拌鍧. 我是还有点印象,就是边做边回忆吧。刚才已经接到预约Skype onsite的通知了

恭喜,LZ加油
回复 支持 反对

使用道具 举报

354886 发表于 2015-7-15 08:38:25 | 显示全部楼层
题目lz能讲一下吗,map-reduce找anagram?
回复 支持 反对

使用道具 举报

 楼主| jerry_lin324 发表于 2015-7-15 08:51:39 | 显示全部楼层

谢谢,看来是这几天疯狂发面经,人品来了
回复 支持 反对

使用道具 举报

 楼主| jerry_lin324 发表于 2015-7-15 08:56:29 | 显示全部楼层
354886 发表于 2015-7-15 08:38
题目lz能讲一下吗,map-reduce找anagram?

就是给你一个document,然后在里面找anagram words。我的思路是这样的:
Mapper:.鏈枃鍘熷垱鑷1point3acres璁哄潧
input:(1,W1),(2,W2),....,(n,Wn),这个input的key-value pair就是最简单的那种mapping关系.
output: key-word,value-vector representation of word, vector是一个26维的,因为有26个英文字母嘛.1point3acres缃
. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
Reducer:
Input: Key-vector,value-list of words has the same vector. 这样在这个list里面所有两两的words都是anagram了。
Output: Key-word1,value-word2

只是个简单思路,大神路过轻喷
回复 支持 反对

使用道具 举报

 楼主| jerry_lin324 发表于 2015-7-15 08:59:31 | 显示全部楼层
say543 发表于 2015-7-15 06:55
thanks for sharing.  so you are requested to come up with a runnable version? or just pseudo code?

just how to manipulate the key-value pair for both mapper and reducer
回复 支持 反对

使用道具 举报

xiaoc10 发表于 2015-7-15 13:12:08 | 显示全部楼层
楼主大好人呀!
回复 支持 反对

使用道具 举报

AndyLiu0429 发表于 2015-7-15 16:48:10 | 显示全部楼层
mapper的输出能不能是key:sorted string,(字母序拍好),value:original stirng。
shuffle的时候所有的anagram组就在一起了,然后reduce合并value-list就好了。
回复 支持 反对

使用道具 举报

MCwong 发表于 2015-7-15 16:51:32 | 显示全部楼层
关于MapReduce求anagrams,有一个疑问还请lz解答: 假设我最终得出的结果是wordA, wordB和wordC互为anagrams, 那么期望的reducer output是不是Key-wordA, Value-[wordB, wordC]
回复 支持 反对

使用道具 举报

 楼主| jerry_lin324 发表于 2015-7-15 23:31:08 | 显示全部楼层
AndyLiu0429 发表于 2015-7-15 16:48
mapper的输出能不能是key:sorted string,(字母序拍好),value:original stirng。
shuffle的时候所有 ...

嗯啊,这样应该也可以。用vector的优点我是这么认为的:vector里面都是0/1,其实这个就很像Leetcode里面那个Excel Column title,你可以把这个vector转换成单一的值。这样当你用一部分数据建立好model,检验一个新的word的时候比较快。
回复 支持 反对

使用道具 举报

 楼主| jerry_lin324 发表于 2015-7-15 23:35:01 | 显示全部楼层
MCwong 发表于 2015-7-15 16:51
关于MapReduce求anagrams,有一个疑问还请lz解答: 假设我最终得出的结果是wordA, wordB和wordC互为anagrams, ...

嗯啊,这样应该也是可以的。
回复 支持 反对

使用道具 举报

say543 发表于 2015-7-16 01:09:02 | 显示全部楼层
my idea is the same 11 floor...
回复 支持 反对

使用道具 举报

头像被屏蔽
ndhuanhuan 发表于 2015-7-22 12:38:15 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

 楼主| jerry_lin324 发表于 2015-7-22 23:45:48 | 显示全部楼层
ndhuanhuan 发表于 2015-7-22 12:38. from: 1point3acres.com/bbs
楼主, 求第三轮面经~ 多谢啦
.1point3acres缃
本人以病,本来三面是这周三,现在取消了。等我康复了再约吧,等面完就来发面经。你什么时候面呢?
回复 支持 反对

使用道具 举报

头像被屏蔽
ndhuanhuan 发表于 2015-7-23 00:41:01 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

siranjoy119 发表于 2017-3-3 09:33:34 | 显示全部楼层
LZ能问一下matrix dimension非常大的时候怎么有效的做dimension reduction吗?因为PCA肯定不行,请问你是怎么答的呢?. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴

谢谢LZ大牛了。。。
回复 支持 反对

使用道具 举报

本版积分规则

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2017-7-28 09:07

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表