国内一线互联网在职谈谈对归国留学生的看法

一亩三分地论坛

 找回密码
 Sign Up 注册获取更多干货
E轮2.5亿美元融资
K12教育独角兽一起作业
北京-诚聘人工智能/教育/大数据岗
[Google级团队]
实时大数据分析领域践行者
北京/深圳-大数据/搜索/机器学习岗
码农求职神器Triplebyte:
不用海投
内推多家公司面试
把贵司招聘信息放这里
查看: 5201|回复: 21
收起左侧

[实习] Dropbox电面

[复制链接] |试试Instant~ |关注本帖
austurela 发表于 2014-11-14 18:47:05 | 显示全部楼层 |阅读模式

2014(10-12月)-[12]CS本科+fresh grad 无实习/全职 - 网上海投| 码农类General实习@Dropbox

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?Sign Up 注册获取更多干货

x
加分
貌似国人面试官,上来直接发link,然后贴题,一言不发
题目是给一个file path,让你把里面所有相同的文件都放到一起,把路径用List<List<String>>输出出来。相同的定义式byte对比相同. 1point 3acres 璁哄潧
相同文件的文件名不一定一样,里面可能还会有sub folder。. more info on 1point3acres.com
面试官态度不好,英语我听着也吃力,郁闷

# Question:
#
# Find files that have the exact same contents in a given directory. Write a function that takes a path and returns a list of lists or sets. Each set should contain files that have the same content.
#  . From 1point 3acres bbs
# An example output is for the input "/foo/" is:
# [. 鍥磋?鎴戜滑@1point 3 acres
#    ["/foo/bar.png", "/foo/images/foo.png"],
#    ["/foo/file.tmp", "/foo/other.temp", "/foo/temp/baz/that.foo"]
# ]. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
#
. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
lz已悲剧,勿念

评分

7

查看全部评分

 楼主| austurela 发表于 2014-11-15 06:42:54 | 显示全部楼层
北美农民 发表于 2014-11-15 05:51. 1point 3acres 璁哄潧
我的思路是重写hashcode() 和 equal() 做优化。。。

hashcode() based on, for example, the first 100 ...

面试官想要的是不要把所有的文件都存在memory里面,你这样是不是还要存所有文件
回复 支持 0 反对 1

使用道具 举报

leixiang5 发表于 2015-9-16 12:33:37 | 显示全部楼层
我昨天刚面。。也是这题目。。不过我这个国人哥哥蛮好的。。
感觉解法应该是这样。
get all files in the directory.
group files by using file metadata, such as file size, file type..
then use hash() for first X amount of data...this will also eliminate some files.
at the end, do full comparison..
回复 支持 1 反对 0

使用道具 举报

 楼主| austurela 发表于 2014-11-14 18:49:15 | 显示全部楼层
准备贴原题,请问如何设置阅览积分
回复 支持 反对

使用道具 举报

seven谷 发表于 2014-11-14 22:57:14 | 显示全部楼层
LZ 我跟你题目一样,虽然遇到的是一个白人,也是一言不发,我写完后就一直问我还能怎么优化,但实在想不出来了。他是做node js的,对我简历上这方面项目很感兴趣,但我觉得答得也不太好,一周后就收到拒信了。

祝你好运~ :)

评分

1

查看全部评分

回复 支持 反对

使用道具 举报

北美农民 发表于 2014-11-15 05:51:46 | 显示全部楼层
我的思路是重写hashcode() 和 equal() 做优化。。。
. From 1point 3acres bbs
hashcode() based on, for example, the first 1000 bytes.
equal() have to ensure the content is exactly the same.
回复 支持 反对

使用道具 举报

北美农民 发表于 2014-11-15 06:59:12 | 显示全部楼层
austurela 发表于 2014-11-14 17:42
面试官想要的是不要把所有的文件都存在memory里面,你这样是不是还要存所有文件

这只需要存reference吧。
回复 支持 反对

使用道具 举报

 楼主| austurela 发表于 2014-11-15 09:42:45 | 显示全部楼层
北美农民 发表于 2014-11-15 06:59
这只需要存reference吧。

恩 这是我在提示之下写的优化
回复 支持 反对

使用道具 举报

YJM1024 发表于 2014-11-17 05:38:07 | 显示全部楼层
我的思路是写一个递归函数遍历所有的文件。相同的文件内容,可以用MD5之类的函数求得一个值,然后放到HashMap里面去。这个HashMap也包括了List。最后遍历HashMap得到所有的List。
回复 支持 反对

使用道具 举报

yjzhengxiao 发表于 2014-11-18 21:23:39 | 显示全部楼层
感觉面试不互动好不专业呀。。。。。
回复 支持 反对

使用道具 举报

liuzhe1218 发表于 2015-1-5 11:21:27 | 显示全部楼层
lz你好,这道题有点没看懂,求解释。。。
回复 支持 反对

使用道具 举报

头像被屏蔽
幻灭天神 发表于 2016-11-20 11:11:27 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

b20160819 发表于 2016-11-21 00:47:10 | 显示全部楼层
leixiang5 发表于 2015-9-16 12:33
我昨天刚面。。也是这题目。。不过我这个国人哥哥蛮好的。。
感觉解法应该是这样。. visit 1point3acres.com for more.
get all files in the ...

每次一1k好难写啊…
回复 支持 反对

使用道具 举报

apologize119 发表于 2016-11-21 04:09:17 | 显示全部楼层
LZ 是海投还是内推?
回复 支持 反对

使用道具 举报

Margaret601 发表于 2017-10-29 13:32:51 | 显示全部楼层
leixiang5 发表于 2015-9-16 12:33
我昨天刚面。。也是这题目。。不过我这个国人哥哥蛮好的。。
感觉解法应该是这样。
. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷get all files in the ...

谢谢层主的思路!我按照你的思路写了一个,但是遇到一点问题请教一下:.鐣欏璁哄潧-涓浜-涓夊垎鍦
我用了hash的方法搞了一个map<String, List<String>>, key是md5的hash结果, value是个list里面装了所有该hash结果的文件路径,可是之后为什么还需要把每个list里面的文件再do full comparison呢?难道hash相同没有办法保证文件内容一样嘛?谢谢LZ!
回复 支持 反对

使用道具 举报

leixiang5 发表于 2017-10-29 13:44:09 | 显示全部楼层
Margaret601 发表于 2017-10-29 13:32
谢谢层主的思路!我按照你的思路写了一个,但是遇到一点问题请教一下:
我用了hash的方法搞了一个map, k ...

hash collision
回复 支持 反对

使用道具 举报

Margaret601 发表于 2017-10-29 13:59:45 | 显示全部楼层
leixiang5 发表于 2017-10-29 13:44.鏈枃鍘熷垱鑷1point3acres璁哄潧
hash collision

谢谢你的回复!我明白了,但是做full comparison的时候有什么优化方法不……我觉得我脑子锈掉了,只想出了两层for循环两两比较,但这样太慢了……层主有什么好的建议嘛
回复 支持 反对

使用道具 举报

leixiang5 发表于 2017-10-29 16:35:23 | 显示全部楼层
Margaret601 发表于 2017-10-29 13:59
谢谢你的回复!我明白了,但是做full comparison的时候有什么优化方法不……我觉得我脑子锈掉了,只想出 ...

full comparison 意思就是 内容比内容...就类似取全部内容as a string..then do string.equals
回复 支持 反对

使用道具 举报

Margaret601 发表于 2017-10-30 02:31:11 | 显示全部楼层
leixiang5 发表于 2017-10-29 16:35
full comparison 意思就是 内容比内容...就类似取全部内容as a string..then do string.equals
. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
谢谢谢谢我已经写出来了,但是对then use hash() for first X amount of data...this will also eliminate some files.表示困惑,为什么会eliminate some files呢?

我是照着你的思路,先按size group了所有文件,然后再对每个group进行hash,存到一个map里, key就是hash value, map的value是个list,存的是解析为该hash value的所有文件的path (……这样是不是不对啊……eliminate了一些文件是什么意思)
然后我又遍历了map,对所有的entry.getValue()这个list里面的文件进行了内容上的比较……

呜呜……求加个微信方便交流可以嘛 (我昨晚就把微信号私你了……拜托拜托)
回复 支持 反对

使用道具 举报

不知道起什么好 发表于 2017-11-4 09:18:32 | 显示全部楼层
Margaret601 发表于 2017-10-30 02:31
谢谢谢谢我已经写出来了,但是对then use hash() for first X amount of data...this will also eliminat ...

我觉得你写的对啊 请问你什么时候面呀
回复 支持 反对

使用道具 举报

本版积分规则

提醒:发帖可以选择内容隐藏,部分板块支持匿名发帖。请认真读完以下全部说明:

■隐藏内容方法: [hide=200]你想要隐藏的内容比如面经[/hide]
■意思是:用户积分低于200则看不到被隐藏的内容
■可以自行设置积分值,不建议太高(200以上太多人看不到),也不建议太低(那就没必要隐藏了)
■建议只隐藏关键内容,比如具体的面试题目、涉及隐私的信息,大部分内容没必要隐藏。
■微信/QQ/电子邮件等,为防止将来被骚扰甚至人肉,以论坛私信方式发给对方最安全。
■匿名发帖的板块和方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2018-4-26 10:11

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表