一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 1138|回复: 3
收起左侧

Amazon Phone

[复制链接] |试试Instant~ |关注本帖
hadesi816 发表于 2016-10-4 01:43:50 | 显示全部楼层 |阅读模式

2016(7-9月) 码农类 硕士 全职@Amazon - 猎头 - 技术电面 |Pass在职跳槽

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
一个log file,每一行都有一条记录,包括三个数据:访问时间,user id,访问的page id。然后让你找出访问次数最多的1组3个连续访问page。
就是如果user A访问了page 1 2 3,这样 1 2 3 就算被访问了一次

. Waral 鍗氬鏈夋洿澶氭枃绔,

评分

1

查看全部评分

本帖被以下淘专辑推荐:

singku 发表于 2016-10-4 02:20:12 | 显示全部楼层
是按user id访问了连续的三个页面算一次吗? 比如A 访问了 1 2 2 3 4 6 这样 1 2/2 3,  2/2 34 这两组都算2次还是算1次?
回复 支持 反对

使用道具 举报

liurudahai 发表于 2016-10-9 08:21:10 | 显示全部楼层
能具体讲讲怎么做吗?
回复 支持 反对

使用道具 举报

 楼主| hadesi816 发表于 2016-10-9 09:53:04 | 显示全部楼层
这题不难,重点在跟面试官交流,理清题目意思(因为面试官说的也不是很清楚)。. 鍥磋鎴戜滑@1point 3 acres
首先,timestamp是没有用的信息,因为Logfile每一条记录都是按时间顺序排好序的(当然这一点你要跟面试官澄清)。
然后你自己举个例子就明白了。比如说一下user_id和page_id组成的Logfile
1,1
2,1
1,3
2,3
1,2
1,4
2,2
2,5. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴

user_id 1访问的page是[1,2,3,4], user_id 2访问的page是[1,2,3,5]
那么所以连续访问的3个page的组合有. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
[1,2,3] 2次
[2,3,4]一次. 1point 3acres 璁哄潧
[2,3,5]一次
所以结果返回1,2,3
至于1楼问的1,2,2这种情况,应该是每一条记录算一次。所以连续访问两次page 2不应该合并成一次,不过你可以跟面试官交流问清楚。

理解题意之后就比较简单了,先定义一个map1,key是user_id, value是访问过的页面。 Loop一遍log,把每一条记录的pageid放到对应的userid的entry里面。
然后loop一遍这个map1,对里面每一个User的list三个三个一组放到另外一个map2,key是page_id组合(我是用下划线分开的,比如1_2_3是一个key),value是访问的次数。. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴

回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-10 23:02

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表