<
回复: 15
收起左侧

想问下meta的top k song

本楼:   👍  1
100%
0%
0   👎
全局:   31
63%
37%
18

2024(4-6月) 码农类General 硕士 全职@meta - 猎头 - Onsite  | 😐 Neutral 😐 AverageOther | 在职跳槽

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x
这是个sd, 实在不知道这题关键点在哪啊
也不需要real time 就map reduce 完事quer
您好!
本帖隐藏的内容需要积分高于 188 才可浏览
您当前积分为 0。
使用VIP即刻解锁阅读权限或查看其他获取积分的方式
游客,您好!
本帖隐藏的内容需要积分高于 188 才可浏览
您当前积分为 0。
VIP即刻解锁阅读权限查看其他获取积分的方式
che加毁了感觉

感觉又跪了

评分

参与人数 1大米 +3 收起 理由
清道神君 + 3 欢迎分享你知道的情况,会给更多大米奖励!

查看全部评分


上一篇:Microsoft onsite interview
下一篇:Stripe Virtual Onsite interview

本帖被以下淘专辑推荐:

  • · Me|主题: 6, 订阅: 0
 楼主| starYZM 2024-4-25 08:11:16 来自APP | 显示全部楼层
本楼:   👍  1
100%
0%
0   👎
全局:   31
63%
37%
18
统一回复 过了 多谢大家

感觉这题最关键的就是不要炫技。。吧。。。
回复

使用道具 举报

 楼主| starYZM 2024-4-25 03:40:42 | 显示全部楼层
本楼:   👍  1
100%
0%
0   👎
全局:   31
63%
37%
18
twocold 发表于 2024-4-23 22:11
https://www.youtube.com/watch?v=kx-XDoPjoHw

可以看看这个

啊, 其实这是我第二次面这个题
我头一次跪 就是想当然的按这个倒霉视频做的。。

题意都理解错了,重点在于是存各自的top k而不是整体的。这个视频是整体的 其实更难更复杂
回复

使用道具 举报

 楼主| starYZM 2024-4-23 11:59:19 | 显示全部楼层
本楼:   👍  1
100%
0%
0   👎
全局:   31
63%
37%
18
感觉被误导了 因为说不用real time,其实这个跟用不用redis 没啥关系
回复

使用道具 举报

 楼主| starYZM 2024-4-23 11:15:48 来自APP | 显示全部楼层
本楼:   👍  0
0%
0%
0   👎
全局:   31
63%
37%
18
个人想了很久 应该直接用redis sorted set存 虽说不要real time
回复

使用道具 举报

地里匿名用户
匿名用户-6QKY4  2024-4-23 11:30:53 来自APP
本楼:   👍  0
0%
0%
0   👎
面试官没有引导一下么?
回复

使用道具 举报

地里匿名用户
匿名用户-Y4CCE  2024-4-23 12:04:43
本楼:   👍  0
0%
0%
0   👎
本帖最后由 匿名 于 2024-4-22 21:11 编辑

问的也太sketchy,别人想帮你复盘也帮不了。
面试官怎么challenge你了,什么biz 场景下map reduce面试官觉得不合理?
这种情况甚至不需要cache。cache是对于那些non-user related的requests多了可以缓存,这个user specific缓存很难说服面试官。

加cache也有的说,cache里应该存什么?
计算完topK之后什么情况下要存进cache?
对topK的accuracy的要求是什么?
用户的events,需要存raw data吗? 还是说只需要存aggregation就行了?
回复

使用道具 举报

 楼主| starYZM 2024-4-23 12:11:48 | 显示全部楼层
本楼:   👍  0
0%
0%
0   👎
全局:   31
63%
37%
18
就是存的是每个人 各自的top 不是整体的。所以我觉得正确答案类似于每个用户用一个redis sorted set存就好
两个特殊需求,
1.数据每七天更新,所以就肯定map reduce, event sourcing 啊
2.用户存自己的top 不是整体的,所以lamda infra用不到, 特意强调了不用real time。感觉就是被这个误导了. real time 跟 query latency是俩事

剩下的都是老生常谈了
回复

使用道具 举报

suitianshiwo 2024-4-24 06:12:04 | 显示全部楼层
本楼:   👍  0
0%
0%
0   👎
全局:   54
72%
28%
21
数据啥时候更新?要求准确度高不高? 多大的数据量? 多少机器?贵不贵?
原始数据的量太大了怎么办?怎么做数据集合?接下来就是大数据了,MR还是spark?各有啥优缺点之类,我就不太懂了。
回复

使用道具 举报

twocold 2024-4-24 10:11:30 来自APP | 显示全部楼层
本楼:   👍  0
0%
0%
0   👎
全局:   365
50%
50%
361
https://www.youtube.com/watch?v=kx-XDoPjoHw

可以看看这个

fast (real time)(用count min sketch)和 slow processor (batch)- (用mapreduce)

补充内容 (2024-04-24 11:24 +08:00):

本帖子中包含更多资源

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x

评分

参与人数 1大米 +1 收起 理由
向月车 + 1 很有用的信息!

查看全部评分

回复

使用道具 举报

 楼主| starYZM 2024-4-24 13:20:39 | 显示全部楼层
本楼:   👍  0
0%
0%
0   👎
全局:   31
63%
37%
18
twocold 发表于 2024-4-23 22:11
https://www.youtube.com/watch?v=kx-XDoPjoHw

可以看看这个

多谢, 这个看过了的 要是这个我就有底了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

Advertisement
>
快速回复 返回顶部 返回列表