注册一亩三分地论坛,查看更多干货!
您需要 登录 才可以下载或查看附件。没有帐号?注册账号
x
之前做了北美携程mle的oa,看了不少地理的面经,感觉他们家都是做一个小case study的oa,题目虽然每年变化,但总体思路应该变化不大。
题目就是预测飞机延误时间的那道,其实很像kaggle上这个case:https://www.kaggle.com/competiti ... ys-spring-2018/data
---
1. 关于modeling
因为给的data有特别多的categorical features,所以我直接上的boosting tree了,这里推荐一个package,叫CatBoost。可以很方便的调包建树加自动算feature importance。
而且这个package的model可以自动handle categorical features,做oa的时候就特别省时间。
2. feature engineering
感觉这个oa其实整体考察的就是怎么构造好的feature来hack最后的MAPE。所以做oa的时间主要都花在建新feature上了。而且给的data包含string表示的date,建议convert成datetime生成新的temporal feature您好! 本帖隐藏的内容需要积分高于 188 才可浏览 您当前积分为 0。 使用VIP即刻解锁阅读权限或查看其他获取积分的方式 游客,您好! 本帖隐藏的内容需要积分高于 188 才可浏览 您当前积分为 0。 VIP即刻解锁阅读权限 或 查看其他获取积分的方式 m%2Fslundberg%2Fshap" rel="nofollow noopener" target="_blank">Shap的package,可以很直观的visualize最后的model prediction到底是怎么算出来的,每个featurewise performance如何。自己以前实习的时候也会用这个package做报告啥的
---
暂时想到的重点就这么多,有问题请留言,一起讨论学习。 |