查看: 1583| 回复: 3
跳转到指定楼层
上一主题 下一主题
收起左侧

[找工就业] 一个大数据分析问题

全局:
1小米
有对同一系统的两组测量数据,但都混入了一些错误数据,现在要估计出哪组数据错误更少更准确,用下面这个参数行吗:

median_absolute_deviation / median. Χ

这个比值越小越好。

这个系数对outliers很robust,而且容易计算。
median_absolute_deviation 是取每个数跟中值的绝对差值的中值,相当于中值差距。除以中值表示误差占比大小,类似coefficient of variance

请问这个系数有专业名称么,有现成理论没有,我刚刚查过Robust Statistics,没找到例子


上一篇:A9的工资会比其他amazon组高吗?
下一篇:求推荐做安卓的ICC
🔗
小六毛 2017-2-17 23:27:36 | 只看该作者
全局:
It looks like quartile coefficient of dispersion ((Q3-Q1)/(Q3+Q1)) somehow (using the order of data instead of value)... 1point3acres
Also, read this threads I found:
http://stats.stackexchange.com/questions/38635/a-robust-non-parametric-measure-like-coefficient-of-variation-iqr-median-o
回复

使用道具 举报

🔗
 楼主| dianek 2017-2-18 02:30:52 | 只看该作者
全局:
小六毛 发表于 2017-2-17 23:27
It looks like quartile coefficient of dispersion ((Q3-Q1)/(Q3+Q1)) somehow (using the order of data  ...

Thanks a lot!
回复

使用道具 举报

🔗
 楼主| dianek 2017-2-22 04:32:26 | 只看该作者
全局:
找到幾篇醫學論文,裡面用RMAD (Relative Median Absolute Deviation)來統計robust error spread,但是沒有發現CS/EE論文。這個RMAD就是mad/median
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

>
快速回复 返回顶部 返回列表