一亩三分地论坛

 找回密码
 Sign Up 注册获取更多干货
码农求职神器Triplebyte:
不用海投,内推你去多家公司面试
Airbnb 数据科学职位
in analytics and inference
天天打游戏、照样领工资,
你要不要来?
把贵司招聘信息放这里
查看: 4840|回复: 21
收起左侧

[实习] Dropbox电面

[复制链接] |试试Instant~ |关注本帖
austurela 发表于 2014-11-14 18:47:05 | 显示全部楼层 |阅读模式

2014(10-12月)-[12]CS本科+fresh grad 无实习/全职 - 网上海投| 码农类实习@Dropbox

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?Sign Up 注册获取更多干货

x
加分
貌似国人面试官,上来直接发link,然后贴题,一言不发.鏈枃鍘熷垱鑷1point3acres璁哄潧
题目是给一个file path,让你把里面所有相同的文件都放到一起,把路径用List<List<String>>输出出来。相同的定义式byte对比相同
相同文件的文件名不一定一样,里面可能还会有sub folder。
面试官态度不好,英语我听着也吃力,郁闷

# Question:
#
# Find files that have the exact same contents in a given directory. Write a function that takes a path and returns a list of lists or sets. Each set should contain files that have the same content.
#  . From 1point 3acres bbs
# An example output is for the input "/foo/" is:
# [. 鍥磋?鎴戜滑@1point 3 acres-google 1point3acres
#    ["/foo/bar.png", "/foo/images/foo.png"],
#    ["/foo/file.tmp", "/foo/other.temp", "/foo/temp/baz/that.foo"]
# ]
#

lz已悲剧,勿念

评分

7

查看全部评分

 楼主| austurela 发表于 2014-11-15 06:42:54 | 显示全部楼层
北美农民 发表于 2014-11-15 05:51
我的思路是重写hashcode() 和 equal() 做优化。。。 .鐣欏璁哄潧-涓浜-涓夊垎鍦

hashcode() based on, for example, the first 100 ...

面试官想要的是不要把所有的文件都存在memory里面,你这样是不是还要存所有文件
回复 支持 0 反对 1

使用道具 举报

leixiang5 发表于 2015-9-16 12:33:37 | 显示全部楼层
我昨天刚面。。也是这题目。。不过我这个国人哥哥蛮好的。。
感觉解法应该是这样。
get all files in the directory.
group files by using file metadata, such as file size, file type... 1point 3acres 璁哄潧
then use hash() for first X amount of data...this will also eliminate some files.
at the end, do full comparison..
回复 支持 1 反对 0

使用道具 举报

 楼主| austurela 发表于 2014-11-14 18:49:15 | 显示全部楼层
准备贴原题,请问如何设置阅览积分
回复 支持 反对

使用道具 举报

seven谷 发表于 2014-11-14 22:57:14 | 显示全部楼层
LZ 我跟你题目一样,虽然遇到的是一个白人,也是一言不发,我写完后就一直问我还能怎么优化,但实在想不出来了。他是做node js的,对我简历上这方面项目很感兴趣,但我觉得答得也不太好,一周后就收到拒信了。. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴

祝你好运~ :)

评分

1

查看全部评分

回复 支持 反对

使用道具 举报

北美农民 发表于 2014-11-15 05:51:46 | 显示全部楼层
我的思路是重写hashcode() 和 equal() 做优化。。。

hashcode() based on, for example, the first 1000 bytes.
equal() have to ensure the content is exactly the same.
回复 支持 反对

使用道具 举报

北美农民 发表于 2014-11-15 06:59:12 | 显示全部楼层
austurela 发表于 2014-11-14 17:42
面试官想要的是不要把所有的文件都存在memory里面,你这样是不是还要存所有文件
. visit 1point3acres.com for more.
这只需要存reference吧。
回复 支持 反对

使用道具 举报

 楼主| austurela 发表于 2014-11-15 09:42:45 | 显示全部楼层
北美农民 发表于 2014-11-15 06:59
这只需要存reference吧。

恩 这是我在提示之下写的优化
回复 支持 反对

使用道具 举报

YJM1024 发表于 2014-11-17 05:38:07 | 显示全部楼层
我的思路是写一个递归函数遍历所有的文件。相同的文件内容,可以用MD5之类的函数求得一个值,然后放到HashMap里面去。这个HashMap也包括了List。最后遍历HashMap得到所有的List。
回复 支持 反对

使用道具 举报

yjzhengxiao 发表于 2014-11-18 21:23:39 | 显示全部楼层
感觉面试不互动好不专业呀。。。。。
回复 支持 反对

使用道具 举报

liuzhe1218 发表于 2015-1-5 11:21:27 | 显示全部楼层
lz你好,这道题有点没看懂,求解释。。。
回复 支持 反对

使用道具 举报

头像被屏蔽
幻灭天神 发表于 2016-11-20 11:11:27 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

b20160819 发表于 2016-11-21 00:47:10 | 显示全部楼层
leixiang5 发表于 2015-9-16 12:33
我昨天刚面。。也是这题目。。不过我这个国人哥哥蛮好的。。.鏈枃鍘熷垱鑷1point3acres璁哄潧
感觉解法应该是这样。. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
get all files in the ...
. From 1point 3acres bbs
每次一1k好难写啊…
回复 支持 反对

使用道具 举报

apologize119 发表于 2016-11-21 04:09:17 | 显示全部楼层
LZ 是海投还是内推?
回复 支持 反对

使用道具 举报

Margaret601 发表于 2017-10-29 13:32:51 | 显示全部楼层
leixiang5 发表于 2015-9-16 12:33
我昨天刚面。。也是这题目。。不过我这个国人哥哥蛮好的。。
. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷感觉解法应该是这样。
get all files in the ...
. from: 1point3acres.com/bbs
谢谢层主的思路!我按照你的思路写了一个,但是遇到一点问题请教一下:
我用了hash的方法搞了一个map<String, List<String>>, key是md5的hash结果, value是个list里面装了所有该hash结果的文件路径,可是之后为什么还需要把每个list里面的文件再do full comparison呢?难道hash相同没有办法保证文件内容一样嘛?谢谢LZ!
回复 支持 反对

使用道具 举报

leixiang5 发表于 2017-10-29 13:44:09 | 显示全部楼层
Margaret601 发表于 2017-10-29 13:32
谢谢层主的思路!我按照你的思路写了一个,但是遇到一点问题请教一下:
我用了hash的方法搞了一个map, k ...

hash collision
回复 支持 反对

使用道具 举报

Margaret601 发表于 2017-10-29 13:59:45 | 显示全部楼层

谢谢你的回复!我明白了,但是做full comparison的时候有什么优化方法不……我觉得我脑子锈掉了,只想出了两层for循环两两比较,但这样太慢了……层主有什么好的建议嘛
回复 支持 反对

使用道具 举报

leixiang5 发表于 2017-10-29 16:35:23 | 显示全部楼层
Margaret601 发表于 2017-10-29 13:59
谢谢你的回复!我明白了,但是做full comparison的时候有什么优化方法不……我觉得我脑子锈掉了,只想出 ...

full comparison 意思就是 内容比内容...就类似取全部内容as a string..then do string.equals
回复 支持 反对

使用道具 举报

Margaret601 发表于 2017-10-30 02:31:11 | 显示全部楼层
leixiang5 发表于 2017-10-29 16:35
full comparison 意思就是 内容比内容...就类似取全部内容as a string..then do string.equals
鏉ユ簮涓浜.涓夊垎鍦拌鍧.
谢谢谢谢我已经写出来了,但是对then use hash() for first X amount of data...this will also eliminate some files.表示困惑,为什么会eliminate some files呢?
. Waral 鍗氬鏈夋洿澶氭枃绔,
我是照着你的思路,先按size group了所有文件,然后再对每个group进行hash,存到一个map里, key就是hash value, map的value是个list,存的是解析为该hash value的所有文件的path (……这样是不是不对啊……eliminate了一些文件是什么意思)
然后我又遍历了map,对所有的entry.getValue()这个list里面的文件进行了内容上的比较……

呜呜……求加个微信方便交流可以嘛 (我昨晚就把微信号私你了……拜托拜托)
回复 支持 反对

使用道具 举报

不知道起什么好 发表于 2017-11-4 09:18:32 | 显示全部楼层
Margaret601 发表于 2017-10-30 02:31
谢谢谢谢我已经写出来了,但是对then use hash() for first X amount of data...this will also eliminat ...

我觉得你写的对啊 请问你什么时候面呀
回复 支持 反对

使用道具 举报

本版积分规则

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2017-12-13 19:22

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表