<
回复: 1
收起左侧

数据🧱电面挂经

匿名用户-N0FVN  2023-12-9 03:11:52
本楼:   👍  1
100%
0%
0   👎

2023(10-12月) 码农类General 硕士 全职@databricks - 猎头 - 技术电面  | 😐 Neutral 😐 AverageFail | 在职跳槽

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x
设计一个SnapshotSet,除了基本的set功能,需要考虑snapshot的特性,比如在任意时刻都可能会有client来基于目前的snapshot来create一个iterator,在这个时间create的iterator只能读取目前的set值而不受之后update得影响,举例

ss = SnapshotSet([1, 2, 3])
ss.add(4)
iter1 = ss.iterator()
ss.remove(1)
iter2 = ss.iterator()
ss.add(6)

...

那这样iter1能够遍历的数据应该是 1,2,3,4;iter2能够遍历的数据应该是2,3,4

脑子木了一直没想到除了每次iterator()被call的时候建立一个copy之外别的办法。。。后来面试官点播才明白我们其实是需要一个version number,每次iterator()被call就version number加1,这样之后的新的update就应该用最新的version number。然后每个iterator只能读到它所对应的version number的所有数据。

比如可以用一个map,记录下每个值的操作记录(同version的add/remove可以进行相应的压缩),用上面的例子就是
map = {}
初始version number = 1
map[1] = [(add, 1)
您好!
本帖隐藏的内容需要积分高于 188 才可浏览
您当前积分为 0。
使用VIP即刻解锁阅读权限或查看其他获取积分的方式
游客,您好!
本帖隐藏的内容需要积分高于 188 才可浏览
您当前积分为 0。
VIP即刻解锁阅读权限查看其他获取积分的方式
个iterator只需要遍历map里面的所有KV pair,找到V数组里面<=自己记录的version number的最后的操作,是add就证明有这个值,空或者是remove就证明没有这个值。

其实这个类似基本的数据库snapshot的实现方式version vector,有想法最重要,实现起来还挺简单的,真佩服这题出的确实挺精妙的!

评分

参与人数 2大米 +11 收起 理由
alexalexhxqhxq + 1 给你点个赞!
清道神君 + 10 欢迎分享你知道的情况,会给更多大米奖励!

查看全部评分


上一篇:分享一个NXT面经
下一篇:奈飞店面挂经
wenlee0816 2024-1-21 09:44:46 | 显示全部楼层
本楼:   👍  0
0%
0%
0   👎
全局:   28
100%
0%
0
可能也可以用rope 從root來決定version

评分

参与人数 1大米 +1 收起 理由
沉默的钱包 + 1 赞一个

查看全部评分

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

Advertisement
>
快速回复 返回顶部 返回列表