《数据科学面试40+真题讲解》,K神本年度最后一次开课


一亩三分地论坛

 找回密码
 Sign Up 注册获取更多干货
码农求职神器Triplebyte:
不用海投,内推你去多家公司面试
Airbnb 数据科学职位
in analytics and inference
天天打游戏、照样领工资,
你要不要来?
把贵司招聘信息放这里
查看: 469|回复: 0
收起左侧

[CareerCup] 讨论一下10.3

[复制链接] |试试Instant~ |关注本帖
sally216 发表于 2014-9-2 22:39:34 | 显示全部楼层 |阅读模式

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?Sign Up 注册获取更多干货

x
本帖最后由 sally216 于 2014-9-2 22:40 编辑

[size=13.63636302948px]题意是一个文件里面有1G的不重复的非负整数,只有10M的内存,找出一个不在文件里
[size=13.63636302948px]面的非负整数。

[size=13.63636302948px]解法和他一样,划分区间再统计,但是智商拙计没有看懂他后面对区间大小的推导。。。
[size=13.63636302948px]我是这样分的,[0, 1000), [1000, 2000)....,这样的话最多只要1M的区间。10M的内
[size=13.63636302948px]存可以开2.5M的整型数组了,所以开一个1M的数组,扫一遍文件记录每个区间里面数字
[size=13.63636302948px]出现的次数。然后再找到一个计数小于1000的区间,再扫一遍文件,找出那1000个数当
[size=13.63636302948px]中没有出现的(这一步目标只有1000个数,内存很小)。
[size=13.63636302948px]搞不懂他最后为啥还要用bit vector。。是不是我算错了。。

本版积分规则

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2017-11-20 04:01

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表