一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 1584|回复: 3
收起左侧

Hulu 电面

[复制链接] |试试Instant~ |关注本帖
jemi 发表于 2016-5-12 05:31:18 | 显示全部楼层 |阅读模式

2016(4-6月) 码农类 硕士 全职@Hulu - 网上海投 - HR筛选 |Other在职跳槽

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
刚结束的 Hulu电面. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴

parse log, a stream of log file like

[started jobname jobId] 鏉ユ簮涓浜.涓夊垎鍦拌鍧.
started download 321. more info on 1point3acres.com
started download 4rdsd
started upload 3213
started transfer fdsX1

[ended jobId time]
ended 321  1342
ended 4rdsd 321 鏉ユ簮涓浜.涓夊垎鍦拌鍧.
ended 3213 123
ended fdsX1 421

. 1point3acres.com/bbs
一个job可以run多次,每次有一个jobId. 每个jobId 需要不同的时间来完成。每个job只算最长一次的时间,问怎么求出top K job的jobId.


比如上面如果 k=2
应该返回
download 321
transfer   fdsX1
.1point3acres缃

楼主先定义一个 Job class. Job class 有 jobName, jobId, time. 然后来一个priorityqueue 并且按照time排序。先把所有job读入heap中, 然后再从heap中读取k个不同的job, 这里注意 如果两个job 有同一个jobName 要dedup.

评分

2

查看全部评分

 楼主| jemi 发表于 2016-5-12 05:31:49 | 显示全部楼层
楼主新人,求大米~~
回复 支持 反对

使用道具 举报

handsomecool 发表于 2016-6-28 07:06:38 | 显示全部楼层
奇怪,感觉started那部分log并没有作用啊,只要看end那部分就够了?

dedup可以先过一遍数据,存进hashmap里面,然后才用priority_queue, 但是需要O(n)的space. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
或者还是priority_queue, 加一个hashmap记录元素在pq里面出现次数,出现过的元素导致pq的size会大于k, 最后输出的时候不要输出dup就好了。 有点麻烦这样。。。

有别的办法不?
回复 支持 反对

使用道具 举报

aiweiwei 发表于 2016-7-21 03:51:43 | 显示全部楼层
请问楼主店面前有OA吗?
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2017-1-22 14:46

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表