《数据科学面试40+真题讲解》,K神本年度最后一次开课


一亩三分地论坛

 找回密码
 Sign Up 注册获取更多干货
码农求职神器Triplebyte:
不用海投,内推你去多家公司面试
Airbnb 数据科学职位
in analytics and inference
天天打游戏、照样领工资,
你要不要来?
把贵司招聘信息放这里
查看: 2492|回复: 5
收起左侧

google phone screen

[复制链接] |试试Instant~ |关注本帖
Susan09 发表于 2016-11-15 06:59:27 | 显示全部楼层 |阅读模式

2017(4-6月) 码农类 博士 实习@Google - 内推 - 技术电面 |Other其他

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?Sign Up 注册获取更多干货

x
面了两轮各45mins,和面试官share一个google doc
.鐣欏璁哄潧-涓浜-涓夊垎鍦
第一轮比较简单:average of last k numbers in data stream,merge intervals
第二轮是一个hashing的题,从来没遇到过,好悲剧。

首先第一题如果你有一个文件,每一行可能有重复[AB, A, B, A],问怎样求得不重复的文件[AB, A, B]
然后第二题是如果这个文件很大内存存不下怎么办。然后面试官没怎么让我回答就说我感觉你应该不知道,要不我告诉你答案吧。思路是如果允许犯一些错,把某一行用一些hash function映射到一个数组h1, h2, ..., hk in [1, N]. 然后把每个hi设成true。问我这样会不会有false positive和false negative。我应该答错了。

只要遇到没见过的题就很方,发挥得不好,这个该如何提高?

本帖被以下淘专辑推荐:

EricZhang 发表于 2016-11-15 11:13:34 | 显示全部楼层
如果输出全部是true,那么结果大部分应该是有这一行,不过也有可能没有这一行,所以有fp。如果输出有false,说明一定没有这一行,所以不会有fn。
回复 支持 1 反对 0

使用道具 举报

zhangxi1994 发表于 2016-11-15 07:46:11 | 显示全部楼层
楼主能再详细解释一下第二题么?
回复 支持 反对

使用道具 举报

johnjavabean 发表于 2016-11-15 07:47:15 | 显示全部楼层
bloomfilter.....
回复 支持 反对

使用道具 举报

dmwu0506 发表于 2016-11-15 12:05:33 | 显示全部楼层
第二题bloom filter
回复 支持 反对

使用道具 举报

dlys3000 发表于 2016-12-23 08:47:33 | 显示全部楼层
多谢楼主分享,第二面 第一问 就是用个hashset 去重就可以了嘛?
回复 支持 反对

使用道具 举报

本版积分规则

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2017-11-20 10:39

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表