一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 627|回复: 1
收起左侧

[找工就业] liveramp 10.9 phone interview

[复制链接] |试试Instant~ |关注本帖
maplain 发表于 2015-10-9 14:33:06 | 显示全部楼层 |阅读模式

2015(7-9月)-[14]CS硕士+3个月-1年 - 网上海投| 码农类全职@LiveRampfresh grad应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
收益于地里面经数次,今晚也发面经回报大家。
. 鍥磋鎴戜滑@1point 3 acres
17:02 -- 17:54 EST phone interview with Piotr. 1point3acres.com/bbs

开始先介绍面试流程。 鏉ユ簮涓浜.涓夊垎鍦拌鍧.

然后问你毕业后ideal job是啥样。

之后问你读master都在干嘛,然后让我介绍了我的cv的project,问得非常详细,以至于朝着一个跟我project不是特别相关的方向不停地问,问到我解释不了为止。可是我说那个不是project focus的地方啊,paper虽然看了,实现细节并没有那么清楚。然后跟他再次讲了下主要要干嘛,他说make sense。.鏈枃鍘熷垱鑷1point3acres璁哄潧

然后是technical question。和之前同学提到的一样,又有点不太一样:
现在有user登陆website后的一些信息,cookie id, timestamp, ip address, user agent,没有account id。你用什么信息来表示unique user。我想了想说ip address + user agent,因为没有更多信息了,这里不知道答的对不对。然后follow up,你有了所有的log file,怎么找出unique的user的数目。之前看了面经,所以有点先入为主地朝着“找到unique的那些行”去回答了。最后他强调只要数目,我才反应过来。我的回答是:
1. 2-step mapreduce, 在step-1,从每行log抽出ip address + user agent(后面统称identifier),然后mapper输出"identifier, 1",combiner,reducer都是加一下数(似乎没啥意义,大家怎么看); step 2中直接数一下文件的总行数。一下子没想出来怎么一步完成,感觉不都发到reducer,是没法确定不同mapper里是不是有重复的啊。。
2. 用distributed hash map,identifier作为key,用一个counter数一下;

follow up: 如果我们只有一台机器,我说sort了以后externel merge sort类似方法数一下;
follow up: 对于distributed hash map详细解释一下调用get()方法之后发生了什么,我就解释了一下consistent hashing 以及dynamo的实现,就是key被映射到一个circle的一个range里,因为每个node都是管replication number个range,所以我知道了key被映射到哪个range后就知道哪个node可能有这个key对应的信息, 然后直接向那个node发request,那个node就向身后的replication number个node发出get的请求,如果有就是有,不然就是没有啦。

然后让我问问题,我问他你在liveramp的技术博客里写到了BANG(big anonymous graph),你们后来有继续improve性能么,是怎么做的?他说他们像文章最后说的那样尝试使用了open source的pregel的一个实现。我又问spark graphx也实现了图的这些iterativede的算法,但是感觉是因为放在了memory,所以快,你们数据量那么大,放不进内存怎么办。感觉mapreduce实现起来又有点慢。这里感觉我似乎没有问清楚。。他回答了半天他们用的那个实现并不是用mapreduce做计算的,只是用来做一些管理和index什么的==!. visit 1point3acres.com for more.

然后,就没有然后了。两个小时过去,挥一挥衣袖,不带走一片云彩。. more info on 1point3acres.com

这哥是波兰人(起码是波兰名字),声音略小,还有点杂音,中间pardon了好几次,还不算我看了之前童鞋面经先入为主的回答。。真是蛋蛋的忧桑。希望后来的同学踩在前人的尸体上,不要只发"phone interview"。加油!

Note:
1. 他们phone interview都不需要写,只需要说;
2. 除了几个帖子里提到问了word ladder2, LRU cache等题,其他人大多问6-degree,  key-value store design, 或者上面说的这种题,注意这是因为这些内容都和他们的业务强相关,毕竟他们是小规模的创业公司。他们的业务是把各个渠道的数据整合起来(一个entity(consumer, device etc)的多个维度的信息),支持marketing团队(不知道我说的对不对) etc。所以喜欢问图上的算法是必然的,而且他们的图都是以边的形式存的 (其实是我猜的==),每个点都是一个unique的identifier,而且图里的每个点都有可能random access,所以他们才自己设计了一个类似dynamo的key-value store(hank(on github))。
. 鍥磋鎴戜滑@1point 3 acres
希望这些胡思乱想对真正对这个公司感兴趣的同学有一些帮助(attitude matters)。.鐣欏璁哄潧-涓浜-涓夊垎鍦

另外,想一想他们家漫天发oa,以及6-degree问题,是不是很有趣。从ceo到possible eligible candidate如果起码6 steps,branch factor又那么大,那么这个hiring process应该怎么搞捏。

评分

2

查看全部评分

面假空虚 发表于 2015-10-21 07:13:55 | 显示全部楼层
楼主最后那段Note2里的分析很棒,多谢啦
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-4 05:58

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表