推荐:数据科学课程和书籍清单以及培训讲座


一亩三分地论坛

 找回密码
 获取更多干活,快来注册

一亩三分地官方iOS手机应用下载
查看: 2432|回复: 4
收起左侧

Hulu 电面

[复制链接] |试试Instant~ |关注本帖
jemi 发表于 2016-5-12 05:31:18 | 显示全部楼层 |阅读模式

2016(4-6月) 码农类 硕士 全职@Hulu - 网上海投 - HR筛选 |Other在职跳槽

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干活,快来注册

x
刚结束的 Hulu电面

parse log, a stream of log file like
. Waral 鍗氬鏈夋洿澶氭枃绔,
[started jobname jobId]
started download 321
started download 4rdsd
started upload 3213
started transfer fdsX1
. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
[ended jobId time]
ended 321  1342
ended 4rdsd 321
ended 3213 123. from: 1point3acres.com/bbs
ended fdsX1 421

. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
一个job可以run多次,每次有一个jobId. 每个jobId 需要不同的时间来完成。每个job只算最长一次的时间,问怎么求出top K job的jobId.


比如上面如果 k=2
应该返回
download 321
transfer   fdsX1. 1point3acres.com/bbs


楼主先定义一个 Job class. Job class 有 jobName, jobId, time. 然后来一个priorityqueue 并且按照time排序。先把所有job读入heap中, 然后再从heap中读取k个不同的job, 这里注意 如果两个job 有同一个jobName 要dedup.
.鏈枃鍘熷垱鑷1point3acres璁哄潧

评分

2

查看全部评分

 楼主| jemi 发表于 2016-5-12 05:31:49 | 显示全部楼层
关注一亩三分地公众号:
Warald_一亩三分地
楼主新人,求大米~~
回复 支持 反对

使用道具 举报

handsomecool 发表于 2016-6-28 07:06:38 | 显示全部楼层
关注一亩三分地微博:
Warald
奇怪,感觉started那部分log并没有作用啊,只要看end那部分就够了?

dedup可以先过一遍数据,存进hashmap里面,然后才用priority_queue, 但是需要O(n)的space
或者还是priority_queue, 加一个hashmap记录元素在pq里面出现次数,出现过的元素导致pq的size会大于k, 最后输出的时候不要输出dup就好了。 有点麻烦这样。。。

有别的办法不?
回复 支持 反对

使用道具 举报

aiweiwei 发表于 2016-7-21 03:51:43 | 显示全部楼层
请问楼主店面前有OA吗?
回复 支持 反对

使用道具 举报

yulizi3000 发表于 2017-6-30 14:52:38 | 显示全部楼层
感谢提供感谢提供感谢提供
回复 支持 反对

使用道具 举报

本版积分规则

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2017-7-24 14:56

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表