一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 1603|回复: 16
收起左侧

Dropbox 电面 March 15

[复制链接] |试试Instant~ |关注本帖
木木 发表于 2016-3-16 06:45:44 | 显示全部楼层 |阅读模式

2016(1-3月) 码农类 硕士 全职@Dropbox - 网上海投 - 技术电面 |Otherfresh grad应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
楼主把电面拖到现在。。也是醉了~  不知道是哪国的姐姐,背景是machine learning但现在在做系统的一个大牛~~. 1point 3acres 璁哄潧
1. 问了我暑期实习那个project好久,那个project涉及到了爬虫抓数据,她就问了多线程爬虫好些问题,比如如何判断每个线程都抓取的正确等~ 然后问了machine learning算法处理数据的细节。。。毕竟人家是这方面出身的么。。。(楼主已经有点心虚先)

2. 题目就还是那个duplicated files, 这回猪脑子的楼主记得保存了code。
Follow up: 这个题没办法在他家那个coderpad里run,她check完代码说没问题之后,问我实际过程中这个work process是怎样的。然后会遇见什么问题导致程序crash? 都分别怎么解决?. From 1point 3acres bbs

楼主就想到一个文件太多,dfs层数过多的时候,会stack overflow, 然后用iterative解决,她又让我写了一遍iterative的解法,我写的非常不clean, 我俩讨论来讨论去。。。时间就没了。。

请地理同学指教下,"实际过程中会遇见什么问题导致程序crash? 都分别怎么解决?"全面些的解答是什么呢?
. 1point3acres.com/bbs

-google 1point3acresBTW:大家可不可以给楼主加点分什么的。。楼主权限太低~ 连之前要OA解法的message都回复不了大家 (我看到的留邮箱的应该都发了). 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷


补充内容 (2016-3-16 06:55):
针对这个题目的"实际过程中会遇见什么问题导致程序crash? 都分别怎么解决?"全面些的解答是什么呢?

评分

5

查看全部评分

 楼主| 木木 发表于 2016-3-16 06:51:47 | 显示全部楼层
import java.util.*;
import java.io.*;
.1point3acres缃
public class DocumentFile{
  List<Set<String>> getSameFiles(String path){
    File currentDir = new File(path);
   
    Map<Long, Set<String>> fileSizeMap = new HashMap<>();
   
    dfs(currentDir, fileSizeMap, path);
   
    List<Set<String>> result = new ArrayList<>();
   
    for(Set<String> candidates : fileSizeMap.values()){.鐣欏璁哄潧-涓浜-涓夊垎鍦
      if(candidate.size() >= 2){
        Map<String, Set<String>> hashValues = new HashMap<>();
        
        for(String s : candidates){
          File f = new File(s);
          String hash = md5(f.getContents()); //MD5 for file content
          if(!hashValues.containsKey(hash)){ 鏉ユ簮涓浜.涓夊垎鍦拌鍧.
            hashValues.push(hash, new HashSet<>());. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
          }
          hashValues.get(hash).add(s);
        }. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
        
        for(Set<String> sameHashedFiles : hashValues.values()){
          if(sameHashedFiles.size() >= 2){
            result.add(sameHashedFiles);
          }
        }
      }       . Waral 鍗氬鏈夋洿澶氭枃绔,
    }
   
    return result;. visit 1point3acres.com for more.
  }. from: 1point3acres.com/bbs
  
  
  void dfs(File dir, Map<Long, Set<String>> fileSizeMap, String pathSofar){. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
    //current one is a file
    if(!dir.isDirectory()){ //may be already exist
      if(!fileSizeMap.containsKey(dir.length())){
        fileSizeMap.put(dir.length(), new HashSet<>());. from: 1point3acres.com/bbs
      }
      fileSizeMap.get(dir.length().add(pathSofar));
      
    }. more info on 1point3acres.com
    //current one is still a directory
    else{
      for(File f : dir.listFiles()){ //path is a parameter to record the path
        dfs(f, fileSizeMap, pathSofar + "/" + f.getName());
      }
    }
    . more info on 1point3acres.com
  }

}

补充内容 (2016-3-16 06:54):
格式咋全乱了。。。。
回复 支持 1 反对 0

使用道具 举报

gjxwin 发表于 2016-3-16 07:08:10 | 显示全部楼层
这题还得考虑优化,先比较大小,然后一个文件1k-2k,2k-3k这么读,才是最优的, 写起来应该很麻烦。我上来直接就说这题我见过。。。
回复 支持 反对

使用道具 举报

 楼主| 木木 发表于 2016-3-16 07:09:23 | 显示全部楼层
gjxwin 发表于 2016-3-16 07:08
这题还得考虑优化,先比较大小,然后一个文件1k-2k,2k-3k这么读,才是最优的, 写起来应该很麻烦。我上来 ...

多谢多谢~!!
回复 支持 反对

使用道具 举报

gracia_g 发表于 2016-3-16 07:19:28 | 显示全部楼层
多谢楼主。还以为他家全面的换了新题,好方。
回复 支持 反对

使用道具 举报

 楼主| 木木 发表于 2016-3-16 08:28:04 | 显示全部楼层
gracia_g 发表于 2016-3-16 07:19
多谢楼主。还以为他家全面的换了新题,好方。

我也以为换了新题~ 但感觉拓展性的问题还是问的好多啊。。
回复 支持 反对

使用道具 举报

547690781 发表于 2016-3-16 08:43:08 | 显示全部楼层
intern ? full time?
回复 支持 反对

使用道具 举报

 楼主| 木木 发表于 2016-3-16 10:51:37 | 显示全部楼层
547690781 发表于 2016-3-16 08:43. 鍥磋鎴戜滑@1point 3 acres
intern ? full time?

上面写了~ Full time
回复 支持 反对

使用道具 举报

jobfinding 发表于 2016-3-17 11:31:47 | 显示全部楼层
多谢楼主分享面经呀,祝楼主早日拿到onsite!
回复 支持 反对

使用道具 举报

 楼主| 木木 发表于 2016-3-17 11:33:49 | 显示全部楼层
jobfinding 发表于 2016-3-17 11:31
多谢楼主分享面经呀,祝楼主早日拿到onsite!

没答好~ 应该要跪
回复 支持 反对

使用道具 举报

jiebour 发表于 2016-3-17 11:55:01 | 显示全部楼层
楼主怎么拿到面试的?多谢!
回复 支持 反对

使用道具 举报

 楼主| 木木 发表于 2016-3-17 11:58:21 | 显示全部楼层
jiebour 发表于 2016-3-17 11:55.鏈枃鍘熷垱鑷1point3acres璁哄潧
楼主怎么拿到面试的?多谢!

. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷他家官网海投的~ HR反应还挺快的
回复 支持 反对

使用道具 举报

jiebour 发表于 2016-3-17 12:10:44 | 显示全部楼层
木木 发表于 2016-3-17 11:58
他家官网海投的~ HR反应还挺快的

投的是new grad的职位吗?我看有SF和seattle俩。。。
回复 支持 反对

使用道具 举报

 楼主| 木木 发表于 2016-3-17 12:12:06 | 显示全部楼层
jiebour 发表于 2016-3-17 12:10
投的是new grad的职位吗?我看有SF和seattle俩。。。

恩恩对~ 是new grad
回复 支持 反对

使用道具 举报

幻灭天神 发表于 2016-11-20 11:56:04 | 显示全部楼层
listFiles()这种函数是面试官给的嘛?还是可以现场去Google呀?
回复 支持 反对

使用道具 举报

 楼主| 木木 发表于 2016-11-21 02:21:16 | 显示全部楼层
幻灭天神 发表于 2016-11-20 11:56
listFiles()这种函数是面试官给的嘛?还是可以现场去Google呀?

没给~~ 我记得当时写代码的时候 她还挺高冷的
回复 支持 反对

使用道具 举报

 楼主| 木木 发表于 2016-11-24 05:31:09 | 显示全部楼层
幻灭天神 发表于 2016-11-20 11:56.1point3acres缃
listFiles()这种函数是面试官给的嘛?还是可以现场去Google呀?

对了。。。你这个头像是啥意思诶~ 为啥最近地里这么多这个头像的账号。。。。。。好奇脸:) 哈哈哈哈
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-11 12:22

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表