《数据科学面试40+真题讲解》,K神本年度最后一次开课


一亩三分地论坛

 找回密码
 Sign Up 注册获取更多干货
码农求职神器Triplebyte:
不用海投,内推你去多家公司面试
Airbnb 数据科学职位
in analytics and inference
天天打游戏、照样领工资,
你要不要来?
把贵司招聘信息放这里
查看: 2848|回复: 42
收起左侧

Facebook 6月底的面经

[复制链接] |试试Instant~ |关注本帖
fentoyal 发表于 2017-8-13 02:42:20 | 显示全部楼层 |阅读模式

2017(4-6月) 码农类 硕士 全职@Facebook - 猎头 - 技术电面 Onsite |Pass在职跳槽

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?Sign Up 注册获取更多干货

x
电话: 鏉ユ簮涓浜.涓夊垎鍦拌鍧.
是个三哥。第一题题目不好描述,就是说有一堆server,每个都有个backup。然后每个server有一个他能做的task的list,然后要求你分配task,让所有task都能运行。当时给我讲题目我都没闹明白(其实我现在也没完全明白,所以不要追问我这题到底想问啥了),我又是DFS,又是回溯,折腾了半个小时,阿三哥一直不满意,我当时觉着自己已经挂了,心里已经开始准备来年再战了,不过还好,我最后一次尝试,他突然这个做法对的,我大喜,于是我在没完全搞明白题目的情况下把这题code出来了。。。
然后这个阿三哥还真不错,他如果说好了,时间不多了,你还有啥问题要问我,然后跟他扯10分钟收摊,我就是必挂无疑了。但他说,还有10分钟,再做一题吧,因为时间不够,你不用写代码,说说思路即可。我说好,然后开启turbo模式。题目是检查两个tree的结构是否 same/symetric.这个意思就是这两个树的每个对应节点的两个孩子,要么一样,要么对称(我的左是他的右)。树是没有value的,不检查值,只判断结构!7分钟秒杀之。然后居然还剩了3分钟讨论下代码怎么写美,聊了下天。然后居然过了! 我给我gf说,这轮电话面试是最后10分钟实现惊天大逆转!大难不死必有后福。

On-site:. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
1. Serialize/Deserialize tree. 我有个自己的与众不同的方法(所谓的表演解)。写完后,面试官表示满意,但提示了下别解法,其实就是经典的pre-order的解法。但他居然提示的是用in-order做,我当时理所应当的认为他说的是对的,就开始写,结果写着写着我发现不对(面试官自己尚未发现,还问我为啥停住了),我给他说这得是pre-order,给他讲了遍,他脸涨的通红,我能理解那种尴尬。。我赶快该成preorder,然后他表示满意。
2. Design a data structure, that supports Add word and can search word tha wild card "." (match a single character)  - Trie 之。
3. 非常面善的blonde阿姨经理,但说话霸气十足。BQ & Josheph ring. 我想上数学解来着,被阻止,说你给我做naive的。遵命做之。
4.白人大叔经理:系统设计。 Status更新系统,可以write status(比如:我好开心),可以search status,search可以用and / or (比如search,天气 and 汽车,只有“天气不好我要坐汽车”这条返回。天气 or 汽车,那就得返回"天气不错“和"汽车坏了”两条)讨论了如何存,用什么数据库,如何search,分析了QPS,讨论如何scale,sharding,如何建index(我把inverted index全程说成了reversed index, 面完才意识到,大慌,感觉药丸。但还好这个他没当回事)。
5.实习面试官:2人,一人面,一人shadow。 strobogrammatic number I, follow up II..鐣欏璁哄潧-涓浜-涓夊垎鍦

总体来讲,应该都是原题,刷题刷好了应该问题都不大。
这里可以辟个谣。显然我这里大部分都是只做一个题,说是必须两题才过的肯定不对。一题多解。或者一题+1 follow up也可。复杂的题,就做一道也可,比如2.
. Waral 鍗氬鏈夋洿澶氭枃绔,


补充内容 (2017-8-13 02:49):
我还有Google和Oracle同一周的面经。但因为Google的好几轮面试官都是国人,我最后签了Google offer,也签了NDA,所就不贴了。Oracle则HM都是国人,而且应该常逛论坛的,所以也不贴了。需要的话可以站内信我。

补充内容 (2017-8-13 05:09):. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
Josheph ring拼写错了,可能Google不到,正确拼写是Josephus ring,Google: Josephus problem

评分

2

查看全部评分

本帖被以下淘专辑推荐:

 楼主| fentoyal 发表于 2017-8-13 02:58:22 | 显示全部楼层
说个Google轶事吧,前无古人的一次面试,那就是第一轮面试,面试官把别人当成我拉进去面了半个小时。我那天等的一个崩溃啊。但最惨的是那个哥们。面了一半被告之白面了,出去找另一个面。。但这个不能全怪面试官,因为她问了那人,说你是XXX(我的名字)吗?那人说Yes。。。后来那人解释说,他以为XXX是面试官自我介绍,说的自己的名字。。。 不过还好,经过紧急临时调整schedule,我第一轮给了半个小时时间。面试官(国人大姐)很有亲和力,我就跟她开了几个玩笑。大家都平复了下心情,这事就过去了。然后硬是做了2题加一个大数据的follow up。估计这轮面试官对我非常满意,从应对突发状况的心里和表现到压力下解题的能力。感觉她可能给了我strong hire(当然也许是我自作多情。。)
回复 支持 1 反对 0

使用道具 举报

进击的菜鸟 发表于 2017-8-13 03:50:26 | 显示全部楼层
请教一下,Josheph ring是啥?
回复 支持 反对

使用道具 举报

chris612ku 发表于 2017-8-13 04:04:36 | 显示全部楼层
楼主能讲讲店面tree same/symetric那题的思路吗?
回复 支持 反对

使用道具 举报

edyyy 发表于 2017-8-13 04:45:22 | 显示全部楼层
虽然楼主说简单,但是我观察最近的题都是越来越难。。。。。。
我是完全做不到无虫每轮两题加follow ups
回复 支持 反对

使用道具 举报

 楼主| fentoyal 发表于 2017-8-13 05:10:58 | 显示全部楼层
进击的菜鸟 发表于 2017-8-13 03:50. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
请教一下,Josheph ring是啥?

抱歉拼错了,应该是Josephus
https://en.wikipedia.org/wiki/Josephus_problem
回复 支持 反对

使用道具 举报

 楼主| fentoyal 发表于 2017-8-13 05:19:38 | 显示全部楼层
chris612ku 发表于 2017-8-13 04:04
楼主能讲讲店面tree same/symetric那题的思路吗?

你就当成这只考虑symmetric或只考虑same做即可,然后把两判断条件或一起。. Waral 鍗氬鏈夋洿澶氭枃绔,
开始比较蒙他说只判断结构,树是没有值的。后来意识到意思就是如果这个节点有左子树,那个节点没有左子树(或者有但是结构不一样),那这就不叫same。但如果这个节点有左子树,无右子树,但对应节点有右子树,无左子树,(且它的右和它的左symmetric),那这就叫symmetric的。
回复 支持 反对

使用道具 举报

mchzh 发表于 2017-8-13 05:45:03 | 显示全部楼层
楼主最后是拿到fb的offer了吗?
回复 支持 反对

使用道具 举报

 楼主| fentoyal 发表于 2017-8-13 06:09:53 | 显示全部楼层
mchzh 发表于 2017-8-13 05:45
楼主最后是拿到fb的offer了吗?

拿到了呀,标签写着Pass呢不是。
回复 支持 反对

使用道具 举报

mchzh 发表于 2017-8-13 06:35:35 | 显示全部楼层
fentoyal 发表于 2017-8-13 06:09
-google 1point3acres拿到了呀,标签写着Pass呢不是。
. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
楼主被google问道的大数据方面是个什么题,一般大数据该怎么答,有什么规则可以参考吗?
回复 支持 反对

使用道具 举报

 楼主| fentoyal 发表于 2017-8-13 06:42:56 | 显示全部楼层
mchzh 发表于 2017-8-13 06:35. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
楼主被google问道的大数据方面是个什么题,一般大数据该怎么答,有什么规则可以参考吗?

我写的不清,不能叫大数据,应该叫海量数据。大数据是data analysis的那种,海量数据是说假设这题的输入不是俩数组,而是分布在2000台机器里的数据,你怎么处理? 我当时就一句话就给秒了,她都说不用我解释了,懂我意思。关键词就是:sort + rehash。这个思想基本是贯彻很多海量数据问题的核心。包括Map Reduce, 其实本质也是sort后rehash。
sort的目的是把一台机器内部相关相近的数据放在一起,便于后续处理。
rehash的目的是把不同机器相关相近的数据发送到同一个机器。换句话说就是所有机器里所有相同的数据应该发到同一台机器去。
你按这个思想做几道海量数据的题,就明白我什么意思了。
回复 支持 反对

使用道具 举报

mchzh 发表于 2017-8-13 06:48:58 | 显示全部楼层
fentoyal 发表于 2017-8-13 06:42
我写的不清,不能叫大数据,应该叫海量数据。大数据是data analysis的那种,海量数据是说假设这题的输入 ...

这个海量数据处理的题目楼主是在哪里看到的,有参考网页什么的吗?多谢!
回复 支持 反对

使用道具 举报

 楼主| fentoyal 发表于 2017-8-13 06:56:00 | 显示全部楼层
mchzh 发表于 2017-8-13 06:48
这个海量数据处理的题目楼主是在哪里看到的,有参考网页什么的吗?多谢!

很多呀,你去网上搜,第一页就有这个:http://blog.csdn.net/v_july_v/article/details/7382693. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
这是很老的帖子了,而且里面有些有问题。比如最后那个随机抽100 int那个。那个显然是蓄水池抽样。. Waral 鍗氬鏈夋洿澶氭枃绔,
不过他的思路你可以参考下。
回复 支持 反对

使用道具 举报

mchzh 发表于 2017-8-13 07:00:01 | 显示全部楼层
fentoyal 发表于 2017-8-13 06:56.鐣欏璁哄潧-涓浜-涓夊垎鍦
很多呀,你去网上搜,第一页就有这个:http://blog.csdn.net/v_july_v/article/details/7382693
这是很 ...

好得,多谢指点,我先琢磨一下,有问题继续请教
回复 支持 反对

使用道具 举报

summerlismile 发表于 2017-8-13 10:40:35 | 显示全部楼层
楼主能不能详细介绍一下4题是怎么答得啊 万分感谢
回复 支持 反对

使用道具 举报

 楼主| fentoyal 发表于 2017-8-13 10:53:39 | 显示全部楼层
summerlismile 发表于 2017-8-13 10:40
楼主能不能详细介绍一下4题是怎么答得啊 万分感谢

这个不画图实在太难讲了。用嘴说说不清的。这题是个面经题(我很悲催的是面完再搜才发现果真是老题,还好也过了),你搜搜有没有现成的解答。

补充内容 (2017-8-13 10:58):. 1point 3acres 璁哄潧
我把能说清的简单说说。数据库可以用nosql的,为了搜索肯定要建inverted index,而且可能得建不只一级。很多地方都能可以cache,比如query的结果。or好办,就是合并结果。and的话得再交一下。
回复 支持 反对

使用道具 举报

summerlismile 发表于 2017-8-13 12:11:03 | 显示全部楼层
多谢楼主的回复 太体贴了 可能建的不止一级 这个是什么意思呢 谢谢
回复 支持 反对

使用道具 举报

hanrui_542 发表于 2017-8-13 14:29:13 | 显示全部楼层
fentoyal 发表于 2017-8-13 06:42. 鍥磋鎴戜滑@1point 3 acres
我写的不清,不能叫大数据,应该叫海量数据。大数据是data analysis的那种,海量数据是说假设这题的输入 ...

rehash是consistent hashing吗,还有其他hash algorithm吗?
回复 支持 反对

使用道具 举报

 楼主| fentoyal 发表于 2017-8-13 14:46:58 | 显示全部楼层
hanrui_542 发表于 2017-8-13 14:29
rehash是consistent hashing吗,还有其他hash algorithm吗?

不是。。别瞎套consistent hashing不是干这个用的
鏉ユ簮涓浜.涓夊垎鍦拌鍧.
补充内容 (2017-8-13 15:14):
当然你想用那个hash也没问题,都是hash。准确的讲。
回复 支持 反对

使用道具 举报

bearicc 发表于 2017-8-13 22:22:40 | 显示全部楼层
请问,tree serialize/deserialize, 所谓的 “表演解” 是什么 ?
回复 支持 反对

使用道具 举报

本版积分规则

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2017-11-25 10:07

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表