<
回复: 20
收起左侧

Tinder MLE 过经分享

本楼:   👍  2
100%
0%
0   👎
全局:   14
100%
0%
0

2021(10-12月) MachineLearningEng 硕士 全职@tinder - Other - 技术电面 Onsite  | 😃 Positive 😐 AveragePass | 应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x
申请+面试时间线:本人是11月初在领英上看到Tinder这个机器学习工程师的岗位,因为团队是做revenue相关的机器学习,加上Tinder这款产品用户基数很大,觉得比较有兴趣就申请了。HR在11月18号邮件联系了我,之后在29号第一次和HR通了电话(期间她有些个人事情耽搁了一下)。12月初跟hiring manager一面;隔了一周完成了终面。

出于对公司的尊重,面试中涉及团队/公司业务较敏感的信息本人一律跳过。团队经理人很好,最后聊的待遇也不错。只是当时有个更喜欢的offer所以没有接。

一面时发现招聘经理是国人小哥,可能比我大不了几岁的样子。我做了简单的自我介绍,同时也介绍了自己之前实习做过的项目。因为有涉及NLP的项目,经理还特意让我解释了一下BERT的基本原理。之后做了一道machine learning的编程题,在一个决策树类中实现找最优decision stump的方法,输入X为不确定维度,所以要找到数据的最优分割维度和分割点,使得损失最小。团队主要做revenue相关项目,有预测用户流失的模型(churn prediction),还有做优惠预测的模型(promotion prediction)-就是如果认为特定用户可能会不用Tinder了系统可能会给他们一些折扣的会员或者free messages。经理还友情提醒了我,团队最近做归因分析比较多,要大致了解X-learner, T-learner什么的(之前我都没听说过)。后来为了准备VO在网上找了点资料看,如果有小伙伴有准备归因的需要,推荐这篇UCB的论文https://www.pnas.org/content/116/10/4156

Virtual onsite:
第一轮 Product:
和一个白人产品经理聊了聊,主要侧重点是作为工程师,怎么理解产品团队的工作以及如何和他们合作。比如如何用非技术同事听的懂语言解释一些问题等等。白人小哥还给我出了一个ML系统设计的题,是关于推送信息的:对于特定用户,假设产品团队已经确定要推送的内容了,如何训练一个能决定一天中什么时间推的模型(这个assumption过于理想,如果是真正的ML系统设计题,连推的内容也要让模型学出来哈哈)。我就从如何收集行为数据,如何构建特征,之后选择模型,训练+调参+交叉验证等等说了一通。因为面试官不是技术出身,所以我说得直白一些。

第二轮 ML case study:
这一轮是在团队待了4年的印度工程师小哥。他问的两道问题全是归因分析相关的:1)有一家保险公司使用多种手段促销,包括打电话、打广告、推荐等等。之前公司sales团队打电话推销的成功率为10%。现在公司技术团队开发出了一个新模型,通过筛选可以让sales团队打电话推销成功率升为20%。sales团队利用该模型寻找潜在用户,之后发现确实成功率升到了20%。但是总保险销售额并没有增长。请问这是怎么回事?如果你是该公司技术团队的成员,该如果修改模型使保险额度实现增长呢?假设公司有过往打电话成功推销的用户信息,和通过其他渠道购买保
您好!
本帖隐藏的内容需要积分高于 188 才可浏览
您当前积分为 0。
使用VIP即刻解锁阅读权限或查看其他获取积分的方式
游客,您好!
本帖隐藏的内容需要积分高于 188 才可浏览
您当前积分为 0。
VIP即刻解锁阅读权限查看其他获取积分的方式
inder Explore类,支持like方法:两个用户id,swiper likes swipee;postTinderPost方法:需要记录内容和时间;以及getExploreTimeline方法: 显示给定用户喜欢的所有用户中最新的10个post。解决方案比较简单,like是一个表,post是另一个表,实现第三个方法就是通过两个表获取所有备选post,放到堆里再pop10个就可以了。
升级版的问题就是把like关系看成是一个图,advancedGetExploreTimeline方法要实现的是给定用户所有能触及的用户中,按关系远近&发布时间排序的10个post。

第五轮 Hiring Manager:
又跟经理聊了一下团队项目重要性,用到的模型和技术等等,还有接下来几天会出结果。略过了。

看到这1700多字的干货,觉得有用的朋友们别忘了加米哦!

评分

参与人数 8大米 +20 收起 理由
渝水流苏 + 1 很有用的信息!
tianqi1212 + 1 给你点个赞!
shiningBloom + 1 给你点个赞!
lunakids + 1 赞一个
清道神君 + 13

查看全部评分


上一篇:亚麻 OA
下一篇:巨硬OA
say543 2022-2-9 16:06:23 | 显示全部楼层
本楼:   👍  0
0%
0%
0   👎
全局:   117
91%
9%
11
KR26 发表于 2022-2-8 12:11
再训练一个模型估计P(boost|user_features),即在没有干涉下用户自己买boost的概率。之后算个收入期望值 ...

我不是太理解 第二轮P(subscription|boost, user_features) - P(subscription|no_boost, user_features) locate 5万个要给免费boost 你的收入大概就已经确定 ?

这个新model P(buy_ boost|user_features)  要怎么在帮助重选5万个 来最大化收入?   lz 指教下
回复

使用道具 举报

 楼主| KR26 2022-2-9 03:58:30 | 显示全部楼层
本楼:   👍  0
0%
0%
0   👎
全局:   14
100%
0%
0
say543 发表于 2022-2-8 00:02
已加米。在一个决策树类中实现找最优decision stump的方法,输入X为不确定维度,所以要找到数据的最优分割维 ...

感谢~ 决策树这个不是概念题,是编程题哈。让你在这个类里实现两个方法,一个fit用来找最优stump,另一个是classify。类构造函数的输入只有X和y两个numpy array,不涉及到什么深度语言模型。我就实现了一下最简单的暴力搜索
回复

使用道具 举报

 楼主| KR26 2022-2-9 04:02:22 | 显示全部楼层
本楼:   👍  0
0%
0%
0   👎
全局:   14
100%
0%
0
say543 发表于 2022-2-8 00:11
第一轮我的想法是把一天切成很多时间段。 log user 时间段active 得时间。然后用这个feature 来train ? 不 ...

能用来训练的用户特征很多,比如活跃度,喜欢用户数,被用户喜欢数,发信息数,年龄,性别,地理位置,照片数,是否为会员等等。过往给用户的推送,是否点击推送进入app就可以当label吧
回复

使用道具 举报

say543 2022-2-8 16:02:36 | 显示全部楼层
本楼:   👍  0
0%
0%
0   👎
全局:   117
91%
9%
11
已加米。在一个决策树类中实现找最优decision stump的方法,输入X为不确定维度,所以要找到数据的最优分割维度和分割点,使得损失最小 =>  本身nlp 的背景 ...不能向mask 依样加padding 就变成一班的decision tree 计算吗?
回复

使用道具 举报

say543 2022-2-8 16:11:40 | 显示全部楼层
本楼:   👍  0
0%
0%
0   👎
全局:   117
91%
9%
11
第一轮我的想法是把一天切成很多时间段。 log user 时间段active 得时间。然后用这个feature 来train ? 不知道有没有什么user 的feedback 可以被利用当作label ?
回复

使用道具 举报

say543 2022-2-8 16:24:27 | 显示全部楼层
本楼:   👍  0
0%
0%
0   👎
全局:   117
91%
9%
11

第二轮的follow up 会是两个models 还是一个model 因为你要估计两个terms?
回复

使用道具 举报

say543 2022-2-8 16:39:14 | 显示全部楼层
本楼:   👍  0
0%
0%
0   👎
全局:   117
91%
9%
11
第二轮能说说怎么把b. 跟sub 应用在同一个 P(subscription|boost, user_features) - P(subscription|no_boost, user_features) ? 小白不会....
回复

使用道具 举报

 楼主| KR26 2022-2-9 04:05:19 | 显示全部楼层
本楼:   👍  0
0%
0%
0   👎
全局:   14
100%
0%
0
say543 发表于 2022-2-8 00:24
第二轮的follow up 会是两个models 还是一个model 因为你要估计两个terms?

可以是两个模型,也可以是一个模型。我发的那篇归因分析的论文里有提到。一个模型的话是否打电话就当成一个特征就好了

评分

参与人数 1大米 +1 收起 理由
say543 + 1 给你点个赞!

查看全部评分

回复

使用道具 举报

 楼主| KR26 2022-2-9 04:11:43 | 显示全部楼层
本楼:   👍  0
0%
0%
0   👎
全局:   14
100%
0%
0
say543 发表于 2022-2-8 00:39
第二轮能说说怎么把b. 跟sub 应用在同一个 P(subscription|boost, user_features) - P(subscription|no_boo ...

再训练一个模型估计P(boost|user_features),即在没有干涉下用户自己买boost的概率。之后算个收入期望值哈
回复

使用道具 举报

say543 2022-2-9 15:17:11 | 显示全部楼层
本楼:   👍  0
0%
0%
0   👎
全局:   117
91%
9%
11
KR26 发表于 2022-2-8 11:58
感谢~ 决策树这个不是概念题,是编程题哈。让你在这个类里实现两个方法,一个fit用来找最优stump,另一 ...

了解了。所以主是考察切割的时候numpy 然后怎么计算gain
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

Advertisement
>
快速回复 返回顶部 返回列表