一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 785|回复: 11
收起左侧

dropbox 电话面经

[复制链接] |试试Instant~ |关注本帖
cocaptainco 发表于 2014-11-27 05:41:53 | 显示全部楼层 |阅读模式

2014(10-12月) 码农类 博士 实习@dropbox - 网上海投 - 技术电面 |Other

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
继上次说要dropbox面试,周一面的,结果问到了经典的给一个filepath,返回一个collection of collection,里面是相同的file(必须要内容相同,如果是只是名字相同,可能内容相同)。 没有好好准备,回答的是先遍历一遍,把所有文件归按size归类,然后再根据某一个size,进行pairwise comparison。我觉得这是我能想到的唯一方法了,面试官对我这种pairwise comparison的不是很满意,问我能不能想到其他的。我觉得除非有个similarity score类似的东西才能避免每个都比较吧。
Anyway,感觉不是很给力,有大侠能解答一下吗?

评分

1

查看全部评分

 楼主| cocaptainco 发表于 2014-11-27 05:43:19 | 显示全部楼层
sorry,文件名相同,内容不一定相同哈~
回复 支持 反对

使用道具 举报

lqs4188980 发表于 2014-11-27 09:23:36 | 显示全部楼层
我瞎说一个,思路我觉得应该是取文件的signature然后比较是否相同,然后你要设计一个生成signature的方法使得相同的文件有相同的signature而不同的文件的signature绝对不同。类似Hash
回复 支持 反对

使用道具 举报

austurela 发表于 2014-11-27 09:40:09 | 显示全部楼层
回复 支持 反对

使用道具 举报

NdrZmansN 发表于 2014-11-27 13:22:05 | 显示全部楼层
可否这样. 用一个map, key 是每个file的checksum (MD5之类), value是相同checksum值的文件paths的set.
遍历完目录和子目录后,把map转化成list返回.
回复 支持 反对

使用道具 举报

qiaokan 发表于 2014-11-27 13:34:42 | 显示全部楼层
这题 可以无限延伸。
挺有意思的一个题。
有多个可以问的点。
回复 支持 反对

使用道具 举报

jrh 发表于 2015-4-10 03:29:07 | 显示全部楼层
大家平时不用git吗? 用SHA1 hash额。。 求大神轻拍
回复 支持 反对

使用道具 举报

nuanuan1208 发表于 2015-9-19 00:41:39 | 显示全部楼层
请问楼长这道题的input是什么呢?我们需要自己写function去parse 路径下所有文件,还是他给一棵建好的directory-file tree?
回复 支持 反对

使用道具 举报

leixiang5 发表于 2015-9-19 01:19:13 | 显示全部楼层
nuanuan1208 发表于 2015-9-19 00:41
请问楼长这道题的input是什么呢?我们需要自己写function去parse 路径下所有文件,还是他给一棵建好的direc ...

input是个directory path..是个String.
回复 支持 反对

使用道具 举报

nuanuan1208 发表于 2015-9-19 02:06:09 | 显示全部楼层
leixiang5 发表于 2015-9-19 01:19-google 1point3acres
input是个directory path..是个String.

谢谢!它家面得真难。。。请问这么做可以吗?一边寻找subdirectory下的file,一边算MD5,按MD5分类好所有文件,最后pairwise对比?
回复 支持 反对

使用道具 举报

leixiang5 发表于 2015-9-19 09:52:46 | 显示全部楼层
nuanuan1208 发表于 2015-9-19 02:06
谢谢!它家面得真难。。。请问这么做可以吗?一边寻找subdirectory下的file,一边算MD5,按MD5分类好所有 ...
-google 1point3acres
其实相比来说。。dropbox面的更类似现实会出现的问题。。
.鏈枃鍘熷垱鑷1point3acres璁哄潧可以这样写。。用dfs或者其他的方法来获得全部files in a directory..存到一个地方。。然后根据file metadata来分类..尽可能的让metadata来剔除一些unique的files或者content类似但是不是相同的。。然后hash每个file..会得到的value来当hash map的key...ha sh map的value就是file path name..
祝你好运。。
回复 支持 反对

使用道具 举报

leixiang5 发表于 2015-9-19 10:01:28 | 显示全部楼层
nuanuan1208 发表于 2015-9-19 02:06
谢谢!它家面得真难。。。请问这么做可以吗?一边寻找subdirectory下的file,一边算MD5,按MD5分类好所有 ...

看到你留言了。我没权利发留言。加qq吧。。375850423
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-11 03:25

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表