推荐:数据科学课程和书籍清单以及培训讲座


一亩三分地论坛

 找回密码
 获取更多干活,快来注册

一亩三分地官方iOS手机应用下载
查看: 790|回复: 4
收起左侧

[统计生统] 有大神能够简单介绍一下missing data的研究情况吗?

[复制链接] |试试Instant~ |关注本帖
玄绿 发表于 2014-2-19 10:19:23 | 显示全部楼层 |阅读模式

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干活,快来注册

x
RT。
比如里面有哪些研究方向,都有哪些进展
shijbian 发表于 2014-2-19 16:12:21 | 显示全部楼层
关注一亩三分地公众号:
Warald_一亩三分地
没有仔细了解过。只是上lecture的时候professor介绍过。

现在主要的data missing分三个种类:
  • complete random missing:就是你从一组数据中随机抽取了几个;
  • random missing:missing value和其他的predictor相关,这个predictor是可以observed也可以是unobserved。eg:穷人做健康问答的missing value比富人的多,这里的missing value和income相关
  • censoring:missing value和missing variable highly related,eg:低收入者更倾向于报告他们的收入情况。

-google 1point3acres主要针对missing data的解决办法是single imputation 和multiple imputation 两种。. From 1point 3acres bbs

Single imputation 就是 replace each missing value with a single number, 这个single number可以是column的mean、medium,甚至是从其他非missing value随机出来的数字(到此的方法,都是针对于complete random missing才适用),还可以是column中其他非missing value拟合出来的值,eg: regress missing value in X_j on X_-j;. 鍥磋鎴戜滑@1point 3 acres

Multiple imputation:也是regress missing value in X_j on X_-j,但是要plus noise and repeated for several times. <http://www.ats.ucla.edu/stat/sas/library/multipleimputation.pdf>


再深的我也不懂了,本身就没学多好。
. more info on 1point3acres.com
. visit 1point3acres.com for more.
不过还是想求点米,想看爆照。

评分

1

查看全部评分

回复 支持 反对

使用道具 举报

 楼主| 玄绿 发表于 2014-2-19 17:53:49 | 显示全部楼层
关注一亩三分地微博:
Warald

非常感谢!

这是本科的lecture吗?
回复 支持 反对

使用道具 举报

shijbian 发表于 2014-2-19 18:48:17 | 显示全部楼层
玄绿 发表于 2014-2-19 17:53
非常感谢!

这是本科的lecture吗?

不是的,graduate的
回复 支持 反对

使用道具 举报

 楼主| 玄绿 发表于 2014-2-19 20:32:44 | 显示全部楼层
shijbian 发表于 2014-2-19 18:48
不是的,graduate的
. more info on 1point3acres.com
能给我发一下lecture讲义吗?谢谢了!
回复 支持 反对

使用道具 举报

本版积分规则

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2017-7-28 23:21

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表