一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 1506|回复: 8
收起左侧

Factual onsite

[复制链接] |试试Instant~ |关注本帖
answerseeker 发表于 2016-3-29 11:45:38 | 显示全部楼层 |阅读模式

2016(4-6月) 分析|数据科学类 硕士 全职@Factual - 校园招聘会 - 技术电面 Onsite |Otherfresh grad应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
版上没啥Factual onsite面经,没簽NDA,分享一下跟DS有关的Data Engineer面经

Factual本身是资料provider, 而他们家data engineer不纯做ETL/data modeling, 还有各种ML等混合体

onsite前有个assignment, 主要就各种regex, 跟一轮电面, 主要讨论on the job decision making, 如何验证米国全部机场, 和Yelp估算所有店家的方法
.鏈枃鍘熷垱鑷1point3acres璁哄潧
onsite当天总共四轮,加lunch跟其他team的随便扯天气,阿法狗啥的. 1point 3acres 璁哄潧

ㄧ 白人小哥PhD, Data Engineer
电面面过这位小哥, 特別亲切, 一直关心时差适应么 天气习惯么

简单介绍一下经验, 考了两题ML
第一题考如何设计一个天气好坏classifier, 如何source data, 定义metric, 如何feature engineering, 如何validate model performance, 考量到区域及季节特性如何split data, 若要设计unsupervised algorithm呢?. 1point3acres.com/bbs

第二题考一个新闻文章分类器, 同第一题, 但是是multi-class 如何挑选model, 如何feature engineering, n-gram feature + structural model, class imbalance, unsupervised scenario 如何处理等-google 1point3acres

二 亚洲小哥 Engineering Manager
比较多behavioral问题, 大都就简历项目问设计概念原理 还有考简单SQL概念 设计DB有什么可能的最优化方法, 如何RDBMS/noSQL tradeoff, 最后讨论下Linux概念, 最喜欢哪个command啊 感觉有点无边无际. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴

三 MIT白人小哥 Software Engineer
脸有点臭,可能Monday blue吧, 不过过程挺和善

上来先考了个balanced parenthesis代码题, 讨论下简历项目, 进入情境题 .1point3acres缃

他们家资料是由多个source汇集而成, 如何对一个地点决定其GPS coordinate为何, 讨论些sampling方法, 进入到各种corner case, 顺序有影响么, 系统性错误如何detect, 多个cluster怎么办, 能从使用者需求考虑如何prioritize么, 当必须使用外部资料时要如何evaluate correctness?

stanford亚洲妹子 Data Engineer
巨多behavioral, 像以前学习最难的过程为何, 如何overcome, 简单介绍你觉得最难的ML概念等

中间有个情境题, 分析如何对不同locale/region name但同postal code的地点做normalization, 有什么考量, 考虑不同国家的corner case又该如何处理?.鐣欏璁哄潧-涓浜-涓夊垎鍦

最后来个简单的Perl debug, 之后閒扯附近有什么景点可逛的

po上来攒人品 求offer 求大米

. 鍥磋鎴戜滑@1point 3 acres. visit 1point3acres.com for more.

补充内容 (2016-3-29 11:53):.鐣欏璁哄潧-涓浜-涓夊垎鍦
最后帮忙他家大力推荐一下, 公司环境感觉很好, 目前有稳定major client, 刚募到B round 30+M刀, 公司positioning相当有潜力, 仍然在快速成长, 上海也有办公室, 可work remotely, 原本不是high priority的, 大加分

评分

3

查看全部评分

 楼主| answerseeker 发表于 2016-4-4 06:57:57 | 显示全部楼层
Sayings 发表于 2016-4-3 17:37. more info on 1point3acres.com
感谢楼主分享,关于如何验证米国全部机场, 和Yelp估算所有店家的方法。。您是怎么回答的呢?

这种题型不方便讲太细,会被认出来。不过基本思路是:

Airport. visit 1point3acres.com for more.
1. Data source: where to find potential list of candidate airports?
2. Data quality verification: how to verify the fields are correct? Can you use multiple sources for confirmation?.鐣欏璁哄潧-涓浜-涓夊垎鍦

Yelp
1. Methodology: how do we construct a crawler? What might be the relevant information needed for the crawler?
2. (This appeared in the follow-up) What happens if we need to prepare a quick estimate within 10 minutes? I suggest to actually check Yelp’s website to understand how information is presented. Find a search criterion and aggregate the counts for all retrieved records. You’ll also need to correct estimation errors based on geographical information.

评分

1

查看全部评分

回复 支持 1 反对 0

使用道具 举报

Sayings 发表于 2016-4-3 17:37:42 | 显示全部楼层
感谢楼主分享,关于如何验证米国全部机场, 和Yelp估算所有店家的方法。。您是怎么回答的呢?
回复 支持 反对

使用道具 举报

Sayings 发表于 2016-4-4 09:02:04 | 显示全部楼层
answerseeker 发表于 2016-4-4 06:57
这种题型不方便讲太细,会被认出来。不过基本思路是:

Airport

谢谢~电面还有什么其他类型的题么?
回复 支持 反对

使用道具 举报

八月 发表于 2016-9-14 02:26:24 | 显示全部楼层
谢谢楼主! 明天电面来取取经
回复 支持 反对

使用道具 举报

BondWong 发表于 2016-9-22 21:43:19 | 显示全部楼层
八月 发表于 2016-9-14 02:26.1point3acres缃
谢谢楼主! 明天电面来取取经

请问你是怎么申请的?
回复 支持 反对

使用道具 举报

八月 发表于 2016-9-24 06:55:15 | 显示全部楼层
BondWong 发表于 2016-9-22 21:43
请问你是怎么申请的?

好像是网投
回复 支持 反对

使用道具 举报

Crazy_fight 发表于 2016-9-27 09:46:42 | 显示全部楼层
谢谢楼主分享
回复 支持 反对

使用道具 举报

ZzzZinia 发表于 2016-11-12 08:43:27 | 显示全部楼层
感谢楼主,好详细~请问最后offer有了么?投了上海办公室,可以人在美帝remotely work么(大雾)?
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-4 14:52

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表