活跃农民-感谢提供高质量信息和讨论

- 积分
- 898
- 学分
- 个
- 大米
- 升
- 人参
- 枚
- 水井
- 尺
- 小麦
- 颗
- 萝卜
- 根
- 小米
- 粒
- UID
- 131966
- 注册时间
- 2014-8-23
- 最后登录
- 1970-1-1
- 在线时间
- 小时
- 好友
- 收听
- 听众
- 日志
- 相册
- 帖子
- 主题
- 分享
- 精华
|
随便给个思路。。。自己yy出来的
通过题目,可以先确定一次访问后会生成什么数据- class onceClick{
- page_id: xxx,. 1point3acres.com/bbs
- ip_address: xxx,
- account_id: xxx,
- time: xxx,
- jumpFrom: xxx
- }
复制代码 然后想法就是每一个用户的行为会产生一个这样的数据集,我们开始考虑如何存储使得效率最高。
场景1, 判断哪个网页访问最多,或者查看每个网页的访问次数和人
那可以做一个pageStatus = linkedList<onceClick>,是某个webpage的所有click数据的链表,因为经常需要插入所以用linked list-google 1point3acres
鏉ユ簮涓浜.涓夊垎鍦拌鍧.
然后所有的pageStatus 做一个ArrayList再串起来,就是全部网页的所有click数据的集合了。如果是公司网站,page增加的不多,那就用ArrayList;如果是新闻门户网站这种每天发好多新的page的,可能会用linkedList比较好,或者HashMap
场景2,根据用户查询他喜欢访问那些page
一般用户的信息都已经有数据库专门存放了,如果nosql可以直接就放一起;如果是mysql等改表的结构不方便,则像场景1一样考虑另外存放。只是这是按用户来分,然后是每个用户的每次click做一个链表串起来。 |
|