传说中的谷歌招聘委员会成员之一,从幕后走出来,教你学系统设计!


一亩三分地论坛

 找回密码
 获取更多干活,快来注册
天天打游戏、照样领工资、还办H1B
这份工作你要不要?
把贵司招聘信息放这里
查看: 795|回复: 4
收起左侧

[统计生统] 有大神能够简单介绍一下missing data的研究情况吗?

[复制链接] |试试Instant~ |关注本帖
玄绿 发表于 2014-2-19 10:19:23 | 显示全部楼层 |阅读模式

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干活,快来注册

x
RT。
比如里面有哪些研究方向,都有哪些进展
shijbian 发表于 2014-2-19 16:12:21 | 显示全部楼层
没有仔细了解过。只是上lecture的时候professor介绍过。

现在主要的data missing分三个种类:
  • complete random missing:就是你从一组数据中随机抽取了几个;
  • random missing:missing value和其他的predictor相关,这个predictor是可以observed也可以是unobserved。eg:穷人做健康问答的missing value比富人的多,这里的missing value和income相关
  • censoring:missing value和missing variable highly related,eg:低收入者更倾向于报告他们的收入情况。
-google 1point3acres
主要针对missing data的解决办法是single imputation 和multiple imputation 两种。.鏈枃鍘熷垱鑷1point3acres璁哄潧

Single imputation 就是 replace each missing value with a single number, 这个single number可以是column的mean、medium,甚至是从其他非missing value随机出来的数字(到此的方法,都是针对于complete random missing才适用),还可以是column中其他非missing value拟合出来的值,eg: regress missing value in X_j on X_-j;

Multiple imputation:也是regress missing value in X_j on X_-j,但是要plus noise and repeated for several times. <http://www.ats.ucla.edu/stat/sas/library/multipleimputation.pdf>
. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷

再深的我也不懂了,本身就没学多好。
. Waral 鍗氬鏈夋洿澶氭枃绔,

不过还是想求点米,想看爆照。

评分

1

查看全部评分

回复 支持 反对

使用道具 举报

 楼主| 玄绿 发表于 2014-2-19 17:53:49 | 显示全部楼层
shijbian 发表于 2014-2-19 16:12 鏉ユ簮涓浜.涓夊垎鍦拌鍧.
没有仔细了解过。只是上lecture的时候professor介绍过。
. Waral 鍗氬鏈夋洿澶氭枃绔,
现在主要的data missing分三个种类:
.鐣欏璁哄潧-涓浜-涓夊垎鍦
非常感谢!. From 1point 3acres bbs
. visit 1point3acres.com for more.
这是本科的lecture吗?
回复 支持 反对

使用道具 举报

shijbian 发表于 2014-2-19 18:48:17 | 显示全部楼层
玄绿 发表于 2014-2-19 17:53
非常感谢!. From 1point 3acres bbs

这是本科的lecture吗?
鏉ユ簮涓浜.涓夊垎鍦拌鍧.
不是的,graduate的
回复 支持 反对

使用道具 举报

 楼主| 玄绿 发表于 2014-2-19 20:32:44 | 显示全部楼层
shijbian 发表于 2014-2-19 18:48
不是的,graduate的

能给我发一下lecture讲义吗?谢谢了!
回复 支持 反对

使用道具 举报

本版积分规则

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2017-9-27 00:53

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表