📣 VIP通行证夏日特惠 限时立减$68
查看: 2752| 回复: 5
跳转到指定楼层
上一主题 下一主题
收起左侧

讨论一道常见的DS面试题

全局:

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x
被问到好几次了,答案对方似乎没有特别满意,发上来和大家一起讨论下
某金融机构给潜在客户发信宣传开户offer,记录respond to offer or not, Y非常unbalanced,例如30million里有10000个1剩下都是0,这种时候:. 1point3acres
1. logistic的问题在哪里
2. 用tree model的话 用single tree可能出现什么问题 one good thing and one bad thing
3. 用什么measure去evaluate model performance and do model selection
4. influential factors


上一篇:Data Science 学习+面试准备清单
下一篇:New Grad 找DS/MLE 被疯狂简历拒,大家觉得正常嘛?
推荐
novavistamn 2019-3-26 23:19:29 | 只看该作者
全局:
3. AUC, F measure, confusion matrix, precision, recall. 4. Undersampling, overzampling, SMOTE.
回复

使用道具 举报

🔗
ccqueeny 2019-3-29 02:40:01 | 只看该作者
全局:
1. Logistic 会predict everything as 0
2. Single tree will give low bias but high variance
3. Prediction & Recall - > F measures, ROC, AUC, etc.
回复

使用道具 举报

全局:
ccqueeny 发表于 2019-03-28 11:40:01
1. Logistic 会predict everything as 0
2. Single tree will give low bias but high
能解释下2么?
回复

使用道具 举报

🔗
e1e4 2023-12-21 13:46:23 来自APP | 只看该作者
全局:
Single tree too simple, will undetfitting--->high bias, low variance
. 1point 3acres
That is why we need forest.
回复

使用道具 举报

🔗
depu0217 2023-12-28 14:41:44 | 只看该作者
全局:
single tree may overfit - memorize the noise in the data which cannot generalize to new data. High variance low bias.
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

>
快速回复 返回顶部 返回列表