一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 2483|回复: 1
收起左侧

[找工就业] 百度NLP部面试经历

[复制链接] |试试Instant~ |关注本帖
zihaolucky 发表于 2014-4-22 11:35:30 | 显示全部楼层 |阅读模式

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
因为不是在海外的面试,所以在这个版发。


前些天去中大听百度NLP组的讲座,一开始我便感觉他们的技术负责人好面熟而且是HKUST毕业的,就更觉得见过了。
然后部门经理开始介绍他们的东西...然后就开始提问环节了。我向他们咨询了一些我在科研训练中遇到的一些困难,是关于指代消歧的。
下来以后我便去问他是否认识杨强老师,他笑着说“他是我老板啊...”

哈哈我果然没有看错,就是在yang qiang的主页上看到过的学生。于是我便投了实习,上周四面试。



.1point3acres缃
面试是去深圳,下午1点开始在他们的休息室(有水果咖啡的地方)进行。先是做了简单的自我介绍,我说了为什么要去这里,是因为想读博,然后这里有那个教授的学生。.鐣欏璁哄潧-涓浜-涓夊垎鍦

然后就开始写代码了,面试官人挺好,一直说“很简单的别紧张”

第一题是说有两个文本文件,第一列均为user_id,第一个文件的第二列是性别,第二个文件的第二列是年龄。现在要求我们把两个文件中共有的user_id和他们的信息(sex & age)取出来,可以用我熟悉的语言,也可以写伪代码。
    我想了挺久,我也不知道有多久,当时脑子空白。到后面用了map的数据结构去找到交集部分。
    面试官接着问,如果我要把另外两个部分取出来呢?怎么做?

    最后在提示之下完成...对数据结构不熟。
.1point3acres缃
然后得到的反馈是,可能写的程序比较少。数据结构不是很熟,是不是有点紧张?


第二题是两个已经排序好的数组,要找到他们的中位数。我先是说合并起来再用快速排序,速度nlogn;然后他问我有没有更快的,我就说利用有序的特点,类似mergesort的操作把复杂度搞到了线性。最后面试官又说,还有没有更快?他说可能又logN的,试试看。我没有想出来,他说没关系,这个有点难。也解释了一下如何做。


第二部分是问项目。问节点影响力怎样做,以及一般怎么衡量找出来的结果的质量。我跟他说了说周涛的论文,说了一下做法。他说嗯这个有道理,是可行的。然后问了情感分析,说是怎样衡量相似度的,我看过一下论文,说可以用RB树,然后把树节点的距离视作相似度。他说嗯。还问了一些别的项目,讨论了一下。

. Waral 鍗氬鏈夋洿澶氭枃绔,
最后问了两个机器学习的题目。一个是说,为什么人们认为logistic regression比linear regression好一些?这个我没搞清楚,所以没答上来。然后是问了个文本分类,其实也不算文本分类,只是个二分类问题——如何把文章标题分类为“体育”或者非体育。我就拿之前上coursera时做过的anti-spam的程序说了一下。
. visit 1point3acres.com for more.
然后他就说,嗯这些你懂得挺多的。


然后就是提问环节。我问他实习生的成长路径是怎样的,可是他似乎没理解我的意思。说,“因为是暑期实习,实习生一般第一个月都是熟悉环境,实际工作的时间很少。天资好一点的也就快一点进入角色。” 然后说“实习期结束后能直接拿到offer留下来的很少,不过如果是校招,遇到实习过的学生,就会要。”
. Waral 鍗氬鏈夋洿澶氭枃绔,
面试官最后向我确认是不是能马上实习,然后持续半年?我说OK。还问我是不是想读博,我说是。.鏈枃鍘熷垱鑷1point3acres璁哄潧

最后,我已经蒙了,体力不支。最后大家握手道别,他送我下楼。. 1point3acres.com/bbs
.1point3acres缃

评分

2

查看全部评分

 楼主| zihaolucky 发表于 2014-4-22 11:53:37 | 显示全部楼层
我感觉他们会很重视代码写的好的同学。对机器学习的要求不会非常高。所以大家可以试试看啊~

我也不知道自己通过没有,感觉不是很好。
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-9 10:15

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表