一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 1791|回复: 11
收起左侧

[找工就业] Factset电面 ML/NLP面经

[复制链接] |试试Instant~ |关注本帖
nibuxing 发表于 2015-2-13 02:25:35 | 显示全部楼层 |阅读模式

2015(1-3月)-[13]IEOR硕士+fresh grad 无实习/全职 - 校园招聘会| 分析|数据科学类实习@Fsctset

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
刚结束的电面,楼主面的是SDE—ML/NLP方向。
1. 先谈简历,问你为什么开始对ML感兴趣
2. 你在XX实习,这个项目是干嘛的, 你是怎么train data的
3. 你另外一个项目是怎么做的,怎么评估它的好坏,有没有用到过Evaluation matrix,我说我一直只用confusion matrix
4. 一篇文章里,怎么把所有heading找出来。.1point3acres缃
5. 一篇文章里,如何把各个公司的名字找出来。如果我要用机器学习方面的方法你有什么方法。
6. 你知不知道  "buygram" 算法,这题我完全不知道这什么算法,这个拼写也是我根据发音大概拼的. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
7. 你主要用什么语言,为什么喜欢用这个语言。
8. 让你提问。

第五第六题有知道的小伙伴请告诉我哈!
没有coding题,没有bahavior question,问得蛮technical的,题都不算难也比较open,但总觉得答得不咋地,而且自己准备的都没面上,一般的ML算法一个没问。。。move on吧。-google 1point3acres

评分

3

查看全部评分

本帖被以下淘专辑推荐:

xurantju 发表于 2015-2-16 08:23:43 | 显示全部楼层
should be bi-gram

评分

1

查看全部评分

回复 支持 反对

使用道具 举报

 楼主| nibuxing 发表于 2015-2-16 09:19:53 | 显示全部楼层

搜到了,非常感谢!
回复 支持 反对

使用道具 举报

小霖子 发表于 2015-3-18 12:55:11 | 显示全部楼层
学长,我加了你的好友但好像等级不够不能给你发消息。。 方便加个QQ嘛?573177637. thx!!
回复 支持 反对

使用道具 举报

小霖子 发表于 2015-3-18 12:56:55 | 显示全部楼层
学长,我加了你的好友,但好像等级不够不能给你发消息。。方便加一下QQ嘛?573177637. thx!!
回复 支持 反对

使用道具 举报

wingschains 发表于 2015-3-20 01:02:55 | 显示全部楼层
好text mining的问题。第四个是Named-entity recognition问题吧,然后可以用conditional random field做。
回复 支持 反对

使用道具 举报

 楼主| nibuxing 发表于 2015-3-20 01:06:40 | 显示全部楼层
小霖子 发表于 2015-3-18 12:55
学长,我加了你的好友但好像等级不够不能给你发消息。。 方便加个QQ嘛?573177637. thx!!

不好意思之前没看到,也没回复提醒。。。我现在加你了。
回复 支持 反对

使用道具 举报

diefunction 发表于 2015-3-20 04:21:24 | 显示全部楼层
第六条应该是问的bigram, language model 的技术
回复 支持 反对

使用道具 举报

diefunction 发表于 2015-3-20 04:23:25 | 显示全部楼层
我觉得第五条可以用NER做,但是第四条NER不是很方便,heading的话最重要的feature是length.....
回复 支持 反对

使用道具 举报

wingschains 发表于 2015-3-21 02:11:15 | 显示全部楼层
diefunction 发表于 2015-3-20 04:23
我觉得第五条可以用NER做,但是第四条NER不是很方便,heading的话最重要的feature是length.....

对的。我看错行了,我想说的是找company name那题用NER。
回复 支持 反对

使用道具 举报

VanessaWasabi 发表于 2015-3-23 22:33:53 | 显示全部楼层
第四题看起来很奇怪啊。有没有上下文?怎么算heading呢?
回复 支持 反对

使用道具 举报

supervicky 发表于 2015-3-24 06:48:16 | 显示全部楼层
4. 一篇文章里,怎么把所有heading找出来。--是不是先爬网页,然后用regular expression来match heading?
5. 一篇文章里,如何把各个公司的名字找出来。如果我要用机器学习方面的方法你有什么方法。 --NER, 是不是直接应用Stanford NLP toolkit里有个神马包,就有所有公司的名字啥的,自动识别出来的。
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-3 03:12

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表