一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 1034|回复: 6
收起左侧

Rakuten (乐天) 在线编程面试

[复制链接] |试试Instant~ |关注本帖
yular 发表于 2016-8-20 15:42:08 | 显示全部楼层 |阅读模式

2016(7-9月) 码农类 硕士 全职@Rakuten(乐天) - 猎头 - 在线笔试 |Other在职跳槽

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
我猜应该多数人是不知道乐天(Rakuten)这家公司的,所以先唠嗑一下这家公司的背景(其实基本上也是上网查和听HR吹的)。乐天是日本最大的电商,可以说是日本的淘宝,一直在和亚马逊争夺日本的市场,是一家很有竞争力的日本企业。现在这家企业走出国门拓展海外市场,到美国和欧洲建立了分部。这家企业非常喜欢招外国人(相对于日本人而言)和PhD,因此在日本读书的不少中国PhD毕业后就去Rakuten工作。最近它在湾区建了一个分部,然后又在波士顿建了一个研究院(估计是想招MIT和harvard的大神吧),完了就发我邮件问我是否感兴趣来波士顿的研究所工作,基本上又是机器学习那些东西。(话说我不是PhD去那里能干啥。。。。给PhD老爷们端茶倒水捶背么~)嗯。。现在开始扯面经。

首先又是HR面。问的问题都是老问题,为啥想离开现在的公司啊,对研究敢不敢兴趣啊,描述下做过的项目之类的。有趣的是,HR很早就联系过我,然后说忘了查邮箱的旧邮件所以没有马上联系我(这个没有马上是足足一个月,怀疑是招不到的人了备胎上 。。。 T_T),然后给我电话的是个女生,最早联系我的HR是个男生,其实我觉得没必要分开吧。。。干嘛就那个男生负责到底呢。

接下来是安排电面时间,由于各种时间冲突安排得比较晚。在电面之前有个在线编程测试,是在hackerrank搞的。现在重点说说那个在线编程测试。

这个测试HR说可以随时做,然后说45分钟可以搞掂,但最后给的时间是3小时。然后由于hackerrank一直不给我权限,又拖了两个星期,搞到今晚才能登录进去做题。题目就一道,相信搞过ML的人都见过(或者类似的),就是给N个文本段落,识别出该段落中的Apple指的是公司还是水果,保证不存在同一个段落的不同Apple指代不同的含义。然后训练集是维基百科的Apple Inc和Apple fruit的文本。由于我之前一直以为是考算法,又一次完全没准备好相关的lib和模板,看到题目之后才发现中了坑。于是我的做法就有点投机取巧了(大神莫嘲笑)。首先我确定了使用bag of word model和linear regression来解题。然后我肉眼读维基百科的文本,将能区分出Apple Inc和Apple fruit的关键字挑出来做成字典,最后一共是80-90个关键字。这样我的bag of word就是一个80-90维度的vector。接下来胡诌了一个80-90维度的factor向量。这个向量本来是需要靠文本算法经过训练后export出来的,但我赶时间就凭感觉列了一堆正负数,大体的思想是,属于Apple Inc的关键字对应的factor是正数,反之是负数。于是,最后的计算结果如果大于一个阈值,就认为是公司,反之则是水果。最后跑程序的时候就是简单的统计所给的单个段落的关键字数目,也就是一个x值vector,完了做一个叉乘 factor*x,求出y,判断y是否大于阈值即可。这种人工做法由于测试数据集不大且关键字把握得较准,第一次跑就跑了高分,于是不想浪费时间就交了,然后通知HR明早起来查看,看能否算通过。

不管怎么说,挺好玩的就是了= =

Hualiang 发表于 2016-8-20 19:35:32 | 显示全部楼层
呃。。。有要求编程语言吗?
回复 支持 反对

使用道具 举报

hxtang 发表于 2016-8-21 00:46:32 | 显示全部楼层
这个给库吗?如果不给库的话生写bag of words + regression model吗...要写一个elegant的3小时也不容易啊....鏈枃鍘熷垱鑷1point3acres璁哄潧
以及你用的是logistic regression还是linear regression?分类用linear感觉怪怪的...
回复 支持 反对

使用道具 举报

mdzzxswl 发表于 2016-8-21 02:22:11 | 显示全部楼层
你面的是日本总部还是湾区分部呀~
回复 支持 反对

使用道具 举报

 楼主| yular 发表于 2016-8-21 02:58:06 | 显示全部楼层
mdzzxswl 发表于 2016-8-21 02:22
你面的是日本总部还是湾区分部呀~

波士顿研究所
回复 支持 反对

使用道具 举报

 楼主| yular 发表于 2016-8-21 02:59:23 | 显示全部楼层
hxtang 发表于 2016-8-21 00:46
这个给库吗?如果不给库的话生写bag of words + regression model吗...要写一个elegant的3小时也不容易啊. ...

当然不给,全部要手写,事先没有模板的话可能会有点窘迫,所以我才投机取巧。然后当然是logistic regression是正解,但我用linear regression调出来后就没有继续刷分了
回复 支持 反对

使用道具 举报

 楼主| yular 发表于 2016-8-21 02:59:36 | 显示全部楼层
Hualiang 发表于 2016-8-20 19:35
呃。。。有要求编程语言吗?
. Waral 鍗氬鏈夋洿澶氭枃绔,
只能python或java
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-4 00:26

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表