一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 1459|回复: 3
收起左侧

Hulu 电面

[复制链接] |试试Instant~ |关注本帖
jemi 发表于 2016-5-12 05:31:18 | 显示全部楼层 |阅读模式

2016(4-6月) 码农类 硕士 全职@Hulu - 网上海投 - HR筛选 |Other在职跳槽

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
刚结束的 Hulu电面

parse log, a stream of log file like
. visit 1point3acres.com for more.
[started jobname jobId]
started download 321
started download 4rdsd
started upload 3213
.鏈枃鍘熷垱鑷1point3acres璁哄潧started transfer fdsX1
. visit 1point3acres.com for more.
[ended jobId time]
ended 321  1342
ended 4rdsd 321
ended 3213 123
ended fdsX1 421


一个job可以run多次,每次有一个jobId. 每个jobId 需要不同的时间来完成。每个job只算最长一次的时间,问怎么求出top K job的jobId.


比如上面如果 k=2
应该返回
download 321
transfer   fdsX1


楼主先定义一个 Job class. Job class 有 jobName, jobId, time. 然后来一个priorityqueue 并且按照time排序。先把所有job读入heap中, 然后再从heap中读取k个不同的job, 这里注意 如果两个job 有同一个jobName 要dedup.

评分

2

查看全部评分

 楼主| jemi 发表于 2016-5-12 05:31:49 | 显示全部楼层
楼主新人,求大米~~
回复 支持 反对

使用道具 举报

handsomecool 发表于 2016-6-28 07:06:38 | 显示全部楼层
奇怪,感觉started那部分log并没有作用啊,只要看end那部分就够了?

dedup可以先过一遍数据,存进hashmap里面,然后才用priority_queue, 但是需要O(n)的space
或者还是priority_queue, 加一个hashmap记录元素在pq里面出现次数,出现过的元素导致pq的size会大于k, 最后输出的时候不要输出dup就好了。 有点麻烦这样。。。

有别的办法不?
回复 支持 反对

使用道具 举报

aiweiwei 发表于 2016-7-21 03:51:43 | 显示全部楼层
请问楼主店面前有OA吗?
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-3 18:14

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表