一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

一亩三分地官方iOS手机应用下载
查看: 2229|回复: 11
收起左侧

[找工就业] Factset电面 ML/NLP面经

[复制链接] |试试Instant~ |关注本帖
nibuxing 发表于 2015-2-13 02:25:35 | 显示全部楼层 |阅读模式

2015(1-3月)-[13]IEOR硕士+fresh grad 无实习/全职 - 校园招聘会| 分析|数据科学类实习@Fsctset

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
刚结束的电面,楼主面的是SDE—ML/NLP方向。. 1point 3acres 璁哄潧
1. 先谈简历,问你为什么开始对ML感兴趣
2. 你在XX实习,这个项目是干嘛的, 你是怎么train data的
3. 你另外一个项目是怎么做的,怎么评估它的好坏,有没有用到过Evaluation matrix,我说我一直只用confusion matrix
4. 一篇文章里,怎么把所有heading找出来。. visit 1point3acres.com for more.
5. 一篇文章里,如何把各个公司的名字找出来。如果我要用机器学习方面的方法你有什么方法。
6. 你知不知道  "buygram" 算法,这题我完全不知道这什么算法,这个拼写也是我根据发音大概拼的
7. 你主要用什么语言,为什么喜欢用这个语言。
8. 让你提问。

第五第六题有知道的小伙伴请告诉我哈!
没有coding题,没有bahavior question,问得蛮technical的,题都不算难也比较open,但总觉得答得不咋地,而且自己准备的都没面上,一般的ML算法一个没问。。。move on吧。. From 1point 3acres bbs

评分

3

查看全部评分

本帖被以下淘专辑推荐:

xurantju 发表于 2015-2-16 08:23:43 | 显示全部楼层
关注一亩三分地公众号:
Warald_一亩三分地
should be bi-gram

评分

1

查看全部评分

回复 支持 反对

使用道具 举报

 楼主| nibuxing 发表于 2015-2-16 09:19:53 | 显示全部楼层
关注一亩三分地微博:
Warald
.1point3acres缃
搜到了,非常感谢!
回复 支持 反对

使用道具 举报

小霖子 发表于 2015-3-18 12:55:11 | 显示全部楼层
学长,我加了你的好友但好像等级不够不能给你发消息。。 方便加个QQ嘛?573177637. thx!!
回复 支持 反对

使用道具 举报

小霖子 发表于 2015-3-18 12:56:55 | 显示全部楼层
学长,我加了你的好友,但好像等级不够不能给你发消息。。方便加一下QQ嘛?573177637. thx!!
回复 支持 反对

使用道具 举报

wingschains 发表于 2015-3-20 01:02:55 | 显示全部楼层
好text mining的问题。第四个是Named-entity recognition问题吧,然后可以用conditional random field做。
回复 支持 反对

使用道具 举报

 楼主| nibuxing 发表于 2015-3-20 01:06:40 | 显示全部楼层
小霖子 发表于 2015-3-18 12:55
学长,我加了你的好友但好像等级不够不能给你发消息。。 方便加个QQ嘛?573177637. thx!!

不好意思之前没看到,也没回复提醒。。。我现在加你了。
回复 支持 反对

使用道具 举报

diefunction 发表于 2015-3-20 04:21:24 | 显示全部楼层
第六条应该是问的bigram, language model 的技术
回复 支持 反对

使用道具 举报

diefunction 发表于 2015-3-20 04:23:25 | 显示全部楼层
我觉得第五条可以用NER做,但是第四条NER不是很方便,heading的话最重要的feature是length.....
回复 支持 反对

使用道具 举报

wingschains 发表于 2015-3-21 02:11:15 | 显示全部楼层
diefunction 发表于 2015-3-20 04:23
我觉得第五条可以用NER做,但是第四条NER不是很方便,heading的话最重要的feature是length.....
. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
对的。我看错行了,我想说的是找company name那题用NER。
回复 支持 反对

使用道具 举报

VanessaWasabi 发表于 2015-3-23 22:33:53 | 显示全部楼层
第四题看起来很奇怪啊。有没有上下文?怎么算heading呢?
回复 支持 反对

使用道具 举报

supervicky 发表于 2015-3-24 06:48:16 | 显示全部楼层
4. 一篇文章里,怎么把所有heading找出来。--是不是先爬网页,然后用regular expression来match heading?
5. 一篇文章里,如何把各个公司的名字找出来。如果我要用机器学习方面的方法你有什么方法。 --NER, 是不是直接应用Stanford NLP toolkit里有个神马包,就有所有公司的名字啥的,自动识别出来的。
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2017-4-26 12:32

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表