回复: 1
收起左侧

机票酒店网站 关于mle oa的一些思路

|只看干货
匿名用户-33D  2022-12-2 03:38:47 |阅读模式
本楼: 👍   100% (2)
 
 
0% (0)   👎

2022(10-12月) MachineLearningEng 本科 全职@expedia - 网上海投 - 在线笔试  | 😐 Neutral 😐 AverageFail | 应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x
之前做了北美携程mle的oa,看了不少地理的面经,感觉他们家都是做一个小case study的oa,题目虽然每年变化,但总体思路应该变化不大。
题目就是预测飞机延误时间的那道,其实很像kaggle上这个case:https://www.kaggle.com/competiti ... ys-spring-2018/data

---
1. 关于modeling
因为给的data有特别多的categorical features,所以我直接上的boosting tree了,这里推荐一个package,叫CatBoost。可以很方便的调包建树加自动算feature importance。
而且这个package的model可以自动handle categorical features,做oa的时候就特别省时间。

2. feature engineering
感觉这个oa其实整体考察的就是怎么构造好的feature来hack最后的MAPE。所以做oa的时间主要都花在建新feature上了。而且给的data包含string表示的date,建议convert成datetime生成新的temporal feature
您好!
本帖隐藏的内容需要积分高于 188 才可浏览
您当前积分为 0。
使用VIP即刻解锁阅读权限或查看其他获取积分的方式
游客,您好!
本帖隐藏的内容需要积分高于 188 才可浏览
您当前积分为 0。
VIP即刻解锁阅读权限查看其他获取积分的方式
m%2Fslundberg%2Fshap" rel="nofollow noopener" target="_blank">Shap的package,可以很直观的visualize最后的model prediction到底是怎么算出来的,每个featurewise performance如何。自己以前实习的时候也会用这个package做报告啥的
---

暂时想到的重点就这么多,有问题请留言,一起讨论学习。

评分

参与人数 3大米 +12 收起 理由
唉喽Y + 1 很有用的信息!
paperclipper + 1 给你点个赞!
清道神君 + 10

查看全部评分


上一篇:square onsite后被recruiter ghost
下一篇:eBay applied researcher - NG
ad03 2022-12-23 11:35:48 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   0% (0)
 
 
0% (0)    👎
What mape did u get?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

>
快速回复 返回顶部 返回列表