《数据科学面试40+真题讲解》,K神本年度最后一次开课


一亩三分地论坛

 找回密码
 Sign Up 注册获取更多干货
码农求职神器Triplebyte:
不用海投,内推你去多家公司面试
Airbnb 数据科学职位
in analytics and inference
天天打游戏、照样领工资,
你要不要来?
把贵司招聘信息放这里
查看: 2784|回复: 4
收起左侧

Hulu 电面

[复制链接] |试试Instant~ |关注本帖
jemi 发表于 2016-5-12 05:31:18 | 显示全部楼层 |阅读模式

2016(4-6月) 码农类 硕士 全职@Hulu - 网上海投 - HR筛选 |Other在职跳槽

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?Sign Up 注册获取更多干货

x
刚结束的 Hulu电面
鏉ユ簮涓浜.涓夊垎鍦拌鍧.
parse log, a stream of log file like

[started jobname jobId]
started download 321
started download 4rdsd
started upload 3213
started transfer fdsX1.1point3acres缃
-google 1point3acres
[ended jobId time]
ended 321  1342
ended 4rdsd 321
ended 3213 123
ended fdsX1 421
. visit 1point3acres.com for more.

一个job可以run多次,每次有一个jobId. 每个jobId 需要不同的时间来完成。每个job只算最长一次的时间,问怎么求出top K job的jobId.. 1point 3acres 璁哄潧


比如上面如果 k=2
应该返回
download 321
transfer   fdsX1

. 1point3acres.com/bbs
楼主先定义一个 Job class. Job class 有 jobName, jobId, time. 然后来一个priorityqueue 并且按照time排序。先把所有job读入heap中, 然后再从heap中读取k个不同的job, 这里注意 如果两个job 有同一个jobName 要dedup. . Waral 鍗氬鏈夋洿澶氭枃绔,

评分

2

查看全部评分

 楼主| jemi 发表于 2016-5-12 05:31:49 | 显示全部楼层
楼主新人,求大米~~
回复 支持 反对

使用道具 举报

handsomecool 发表于 2016-6-28 07:06:38 | 显示全部楼层
奇怪,感觉started那部分log并没有作用啊,只要看end那部分就够了?
.1point3acres缃
dedup可以先过一遍数据,存进hashmap里面,然后才用priority_queue, 但是需要O(n)的space
或者还是priority_queue, 加一个hashmap记录元素在pq里面出现次数,出现过的元素导致pq的size会大于k, 最后输出的时候不要输出dup就好了。 有点麻烦这样。。。
. Waral 鍗氬鏈夋洿澶氭枃绔,
有别的办法不?
回复 支持 反对

使用道具 举报

aiweiwei 发表于 2016-7-21 03:51:43 | 显示全部楼层
请问楼主店面前有OA吗?
回复 支持 反对

使用道具 举报

yulizi3000 发表于 2017-6-30 14:52:38 | 显示全部楼层
感谢提供感谢提供感谢提供
回复 支持 反对

使用道具 举报

本版积分规则

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2017-11-24 21:27

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表