《数据科学面试40+真题讲解》,K神本年度最后一次开课


一亩三分地论坛

 找回密码
 Sign Up 注册获取更多干货
码农求职神器Triplebyte:
不用海投,内推你去多家公司面试
Airbnb 数据科学职位
in analytics and inference
天天打游戏、照样领工资,
你要不要来?
把贵司招聘信息放这里
查看: 1535|回复: 17
收起左侧

G家电面

[复制链接] |试试Instant~ |关注本帖
wdlile 发表于 2014-8-16 02:43:27 | 显示全部楼层 |阅读模式

2014(10-12月) 码农类 硕士 全职@Google - 网上海投 - 技术电面 |Other

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?Sign Up 注册获取更多干货

x
出了一道奇葩的题。。感觉跪了

是个国人,人比较nice。

给一堆数,代表时间戳/访问人数,输出整理出如果在相应时间内有时间戳,就输出出来,没有就填NaN。如果在短时间内有多个时间戳,就留下一个。
鏉ユ簮涓浜.涓夊垎鍦拌鍧.
sampling interval: 100
input sequence:
timestamps value
1012 7
1102 5
1095 3
1199 10
1405 8
output sequence:
timestamps value
1012 7
1102 5 (or 1095 3)
1199 10
1300 NaN
1405 8

. Waral 鍗氬鏈夋洿澶氭枃绔,
follow up就是问complexity。问了好多,都说我自己定义就好,比方说怎么叫短时间,从什么时候开始计算。比较烦这样的题啊,需求都不是很明确的样子。
唉。。泪奔啊。。

评分

2

查看全部评分

cztianshi 发表于 2014-8-16 05:40:58 | 显示全部楼层
下周也要电面了,感觉各种不靠谱。。。。
回复 支持 反对

使用道具 举报

zhaorui1991 发表于 2014-8-18 10:13:46 | 显示全部楼层
明天上午就要面了,求保佑
回复 支持 反对

使用道具 举报

北美农民 发表于 2014-8-18 10:18:48 | 显示全部楼层
没看出奇葩? 不就是简单地hash? 我有没理解到题意的地方吗。
回复 支持 反对

使用道具 举报

 楼主| wdlile 发表于 2014-8-18 20:38:28 | 显示全部楼层
北美农民 发表于 2014-8-18 10:18
没看出奇葩? 不就是简单地hash? 我有没理解到题意的地方吗。

原来如此。。
回复 支持 反对

使用道具 举报

jfwwlong 发表于 2014-8-18 22:14:38 | 显示全部楼层
这题是什么意思,还是没太看懂。。。
回复 支持 反对

使用道具 举报

sj1456 发表于 2014-8-18 23:06:35 | 显示全部楼层
感谢楼主分享,另外想问一下,电面的时候这个题目是他口头给你描述还是给你在google doc上写好?
回复 支持 反对

使用道具 举报

 楼主| wdlile 发表于 2014-8-18 23:10:06 | 显示全部楼层
jfwwlong 发表于 2014-8-18 22:14
这题是什么意思,还是没太看懂。。。

就是比方说有几台机器,平均每100ms打印出一个时间戳和一个访问人数的计数。但是时间不是很精确。有的时候早一点有的时候晚一点。有的时候没有访问人数就不打印出来。. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴

现在进行一下统计,每个时间段留下一条数据,如果在短时间内有多条数据,就留下一条;如果那个时间段里没有数据,就生成一条NaN。
回复 支持 反对

使用道具 举报

 楼主| wdlile 发表于 2014-8-18 23:29:55 | 显示全部楼层
sj1456 发表于 2014-8-18 23:06
感谢楼主分享,另外想问一下,电面的时候这个题目是他口头给你描述还是给你在google doc上写好?

上来没聊两句就直接把题目粘到doc上
回复 支持 反对

使用道具 举报

 楼主| wdlile 发表于 2014-8-20 05:34:52 | 显示全部楼层
北美农民 发表于 2014-8-18 10:18
没看出奇葩? 不就是简单地hash? 我有没理解到题意的地方吗。

不过面试官跟我说有O(1)的解法。。
回复 支持 反对

使用道具 举报

littlecoolblaxk 发表于 2014-8-22 05:19:45 | 显示全部楼层
路过的小伙伴分享一下思路吧。我没太懂hash解法 可否简单说一下?

我只有最弱的方法: 遍历时间戳 当出现大于“当前时间戳+自定义的短时间” 的时间戳出现 就输出 当然细节还要处理NAN的情况 不过时间复杂度都一样 就是o(n)了。。也可能我理解不对 求帮忙打开思路
回复 支持 反对

使用道具 举报

littlecoolblaxk 发表于 2014-8-22 05:23:36 | 显示全部楼层
无法想象O(1)啊 输出都是 n / sample interval 了吧 也就相当于0(n)了  顺便问一下时间戳不是排好序的么?(抱歉不是太懂时间戳)
回复 支持 反对

使用道具 举报

小K 发表于 2014-8-22 06:07:46 | 显示全部楼层
没看懂
无论是否排序,读一遍数据不是也需要O(N)了吗?
难道是map reduce神马的?
回复 支持 反对

使用道具 举报

rainbow767 发表于 2014-8-22 06:28:14 | 显示全部楼层
cztianshi 发表于 2014-8-15 13:40. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
下周也要电面了,感觉各种不靠谱。。。。

google啊。那是大牛才能过的面试。
回复 支持 反对

使用道具 举报

 楼主| wdlile 发表于 2014-8-22 07:01:08 | 显示全部楼层
littlecoolblaxk 发表于 2014-8-22 05:23
无法想象O(1)啊 输出都是 n / sample interval 了吧 也就相当于0(n)了  顺便问一下时间戳不是排好序的 ...

sorry,我说的是空间复杂度O(1), 时间复杂度是O(n)
回复 支持 反对

使用道具 举报

 楼主| wdlile 发表于 2014-8-22 07:05:13 | 显示全部楼层
面试官说可以in place的算法。。
回复 支持 反对

使用道具 举报

Gill9907 发表于 2014-8-25 14:29:40 | 显示全部楼层
O(1) place 应该不能hash了吧. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
输入可以自己定义吗? 线性表的话,因为要插入NaN 应该不能用array
那为什么我觉得用一个linkedlist就OK?
求大牛来指正~
回复 支持 反对

使用道具 举报

1guangnian 发表于 2014-8-25 14:40:25 | 显示全部楼层
如果时间戳按照顺序给,可以记录前一个时间戳和前一个时间戳有没有输出,如果前一个和当前的在一个时间点的附近,并且输出了,当前就不输出了,不然就输出下呗 . From 1point 3acres bbs
这里按照顺序指在一个时间点周围的都是连续给出的 . 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
不知道这样行不
回复 支持 反对

使用道具 举报

本版积分规则

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2017-11-24 15:41

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表