一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 1610|回复: 13
收起左侧

Yelp sw-data mining组

[复制链接] |试试Instant~ |关注本帖
cradlelive 发表于 2015-10-30 14:10:28 | 显示全部楼层 |阅读模式

2015(10-12月) 码农类 硕士 全职@Yelp - 网上海投 - 技术电面 |Failfresh grad应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x

发个面经求RP喽~
上周五面的google hangout, 其实我周一就接到拒信了,现在发出来给别的面试求RP~跪求offer啊

8月网上海投,HR chat了之后给我约了data mining组的面试,HR没有问我那些QandA,而且也没给我发OA,就直接约电面了我还挺奇怪的。-google 1point3acres

anyway,电面是个很nice的白哥哥,前20多分钟问了下觉得yelp可以增加那些feature,哪些地方不好,该如何改进,这样改进后有什么后果之类的blahblah的问题

然后做题,给你一个log,里面是用户搜索的记录,返回出现次数top 100的词。log格式如下:

{query: "coffee"}
{query: "pizza"}
{query: "tea"}
{query: "pizza"}
. 鍥磋鎴戜滑@1point 3 acres
需要把单词parse出来,然后返回pizza, coffee这样。

反正写的不好,面完我就知道等着收拒信就行了,不过小哥人真的很好啊,最后剩点时间来不及问别的了,还跟我笑笑聊聊天什么的~

跪求RP

评分

1

查看全部评分

本帖被以下淘专辑推荐:

ningchris 发表于 2015-11-3 00:38:18 | 显示全部楼层
请问这道题是用 sql/mongodb query解还是要自己写一个函数?

如果用mongodb的话 . 鍥磋鎴戜滑@1point 3 acres
db.collection.aggregate(
   {$group : { _id : '$query', count : {$sum : 1}}},
   {$sort: { _id: '$query'}},
   {$limit: 100}
).result
回复 支持 反对

使用道具 举报

alvinca123 发表于 2015-11-3 01:37:21 | 显示全部楼层
遇到了好人,也许会收到下一面的。。。
回复 支持 反对

使用道具 举报

 楼主| cradlelive 发表于 2015-11-3 05:03:37 | 显示全部楼层
ningchris 发表于 2015-11-3 00:38
请问这道题是用 sql/mongodb query解还是要自己写一个函数?

如果用mongodb的话

自己写个函数~
回复 支持 反对

使用道具 举报

superxiaoding 发表于 2015-11-7 11:36:01 | 显示全部楼层
想请问楼主,自己写函数是什么意思?
谢谢!
回复 支持 反对

使用道具 举报

 楼主| cradlelive 发表于 2015-11-8 03:18:01 | 显示全部楼层
superxiaoding 发表于 2015-11-7 11:36 鏉ユ簮涓浜.涓夊垎鍦拌鍧.
想请问楼主,自己写函数是什么意思?
谢谢!
.1point3acres缃
就是正常的技术电面的那种coding。上面不是有个人问能不能用数据库语言写嘛,就是mongo之类的,我就说不能用数据库语言,要自己正常写function~
回复 支持 反对

使用道具 举报

aiwojiujiu 发表于 2015-11-9 05:07:30 | 显示全部楼层
请问楼主给出了什么解法? 为什么感觉自己肯定跪了呢?
回复 支持 反对

使用道具 举报

dongyun 发表于 2015-11-10 03:47:39 | 显示全部楼层
这个是json format?  
回复 支持 反对

使用道具 举报

 楼主| cradlelive 发表于 2015-11-10 06:25:53 | 显示全部楼层

楼主只是个MS~~
回复 支持 反对

使用道具 举报

 楼主| cradlelive 发表于 2015-11-10 07:06:57 | 显示全部楼层
aiwojiujiu 发表于 2015-11-9 05:07. more info on 1point3acres.com
请问楼主给出了什么解法? 为什么感觉自己肯定跪了呢?

因为楼主突然卡住了。。。

本来parse那部分我是打算写个regular expression去match单词的,无奈一年多没写过,早忘了,最后用split()的

然后hashmap算出现次数,最关键的是找出hashmap里出现频率最高的100个单词,楼主脑子突然卡克了,不知道怎么算了。。。最后烂爆了的算法就是一次次去找当前map里value最高的key,把这个加进结果集里,然后从map里把它删掉,再去找下一个。。。
回复 支持 反对

使用道具 举报

 楼主| cradlelive 发表于 2015-11-10 07:08:28 | 显示全部楼层
dongyun 发表于 2015-11-10 03:47-google 1point3acres
这个是json format?

不知道诶,楼主对数据库不熟,当时面试官先问我用哪种语言,我说java,然后他就出题了
回复 支持 反对

使用道具 举报

dongyun 发表于 2015-11-10 09:05:44 | 显示全部楼层
应该是简单地json format, 不过自己写parse 也没啥问题, 排序的话C++ 里的map  <red-black tree> 是可以自动排序的, java 里应该也有 TreeMap 什么的
回复 支持 反对

使用道具 举报

 楼主| cradlelive 发表于 2015-11-11 09:39:01 | 显示全部楼层
dongyun 发表于 2015-11-10 09:05
应该是简单地json format, 不过自己写parse 也没啥问题, 排序的话C++ 里的map   是可以自动排序的, java  ...

红黑树我确实是没想到,还是自己做题做少了,之前只是大致看过一下红黑树,都没有刷过相关的题~
. 鍥磋鎴戜滑@1point 3 acres
谢谢层主,发出来也是想看看大家怎么做这题的~~
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-5 19:11

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表