📣 独立日限时特惠: VIP通行证立减$68
楼主: modifiedname
跳转到指定楼层
上一主题 下一主题
收起左侧

[统计生统] 统计类工作technical interview 刷题系列 - Mixed model

   
🔗
觉即不随 2014-1-12 04:25:45 | 只看该作者
全局:
十分感谢 wwrechard 同学帮忙复习Bayesian!

About REML and ML:
The biggest difference between the two lies in generalized linear mixed model estimate.  

ML: The estimate that maximizes the log-likelihood function. For example, to estimate the fixed and random effect in a linear mixed model, we pud down the log-likelihood function which involves the fixed effects and variance components, and then find the maximum.  
MLE is asymptotically unbiased.  But in a mixed effect model, the estimate for variance components is biased.

REML: Targeting at getting an unbiased estimate for the variance components in the mixed model.  The algorithm would fit the fixed part of th e model first and then use the residuals to fit the log-likelihood on the variance components.  
. 1point 3acres
In R and SAS, we always have both options.  The default in SAS proc glmmix, the default is REML.
回复

使用道具 举报

🔗
觉即不随 2014-1-12 04:28:08 | 只看该作者
全局:
还有,LZ,你的求MLE的算法部分,EM和Newton method,后面的解释怎么是两个方法掺杂着来的呢。。。?
回复

使用道具 举报

🔗
 楼主| modifiedname 2014-1-12 04:56:38 | 只看该作者
全局:
觉即不随 发表于 2014-1-11 15:28
还有,LZ,你的求MLE的算法部分,EM和Newton method,后面的解释怎么是两个方法掺杂着来的呢。。。?

感谢讨论!
应该是怎样的呢?这块我的确理解的很差。
回复

使用道具 举报

🔗
觉即不随 2014-1-12 05:21:44 | 只看该作者
全局:
本帖最后由 觉即不随 于 2014-1-12 05:25 编辑 .

EM algorithm: The algorithm relies on complete data computation.  A latent data model is assumed.
E step: Given the observations, we can calculate the expectation of the latent data.  Thus gives us a function of the parameters, given the observations.
M step: maximize the function we got from E step.
Repeating the two steps, until the targeting log likelihood barely changes, or the parameters barely changes.
. check 1point3acres for more.
EM algorithm is guaranteed to ascend over iterations.
. Waral dи,

Newton's method:
1) Approximate the target function with a second order Taylor expansion at the current iteration point.  This will involve the score function, and an observed Fisher information matrix (negative of observed Hessian matrix).
2) Take first order derivative with this approximation.
3) Equate the first order derivative with 0, and solve for the update of the parameters.  

Newton method is sometimes un-stable, i.e. it does not guarantee the ascend of the targeting function.  The reason is that in the 3rd step, the inversion of the observed Hessian matrix is required.  But in cases that the targeting function is not convex, the observed Fisher information matrix might not be positive definite, which causes numerical problem when taking inverse.

艾玛。。。写这么长。。。lz,我很啰嗦。。。

点评

额。。。上面讲错了。。。EM不需要convex...呜呜呜  发表于 2014-1-14 07:42
不太同意关于牛顿法的drawback那个部分的描述。如果涉及到convex的话,EM保证每步都增大的条件也是目标log likehood必须是convex的,因为证明那一步需要Jensen's inequality。  发表于 2014-1-12 06:30
回复

使用道具 举报

🔗
觉即不随 2014-1-12 05:47:17 | 只看该作者
全局:
lz别嫌弃,因为我在国内没学过统计,所以涉及到专业问题还是用英文说快一点,也准确点~
回复

使用道具 举报

🔗
hitchpy 2014-1-12 06:04:04 | 只看该作者
全局:
太感激了!!!我觉得最需要的就是这方面的信息,而前辈们的经验让后辈受益匪浅!!
回复

使用道具 举报

🔗
relakuma 2014-1-12 06:11:28 | 只看该作者
全局:
本帖最后由 wwrechard 于 2014-1-14 07:44 编辑 .google  и

不太同意关于牛顿法的drawback那个部分的描述。【如果涉及到convex的话,EM保证每步都增大的条件也是目标log likehood必须是convex的,因为证明那一步需要Jensen's inequality。另外,<--讲错了。。。】EM推广来说是一种特殊的MM算法,而Newton法在很多情况下也能划归到MM算法(局部二次近似,且二次函数小于原函数),convex是保证MM算法收敛必须的条件。另外,据我自己的经验来说,牛顿法收敛是很快的(不单单是统计问题),因为是二次收敛的速度,代价是存储太大。关于Hessian matrix不正定的问题,一般数值上有很多解决办法,对应到统计里面比如ridge regression就是一种。
回复

使用道具 举报

🔗
relakuma 2014-1-12 06:28:49 | 只看该作者
全局:
以前没太关注过mixed model的问题,这次乘机去看了Laird 1982和Jennrich 1986的paper。Laird 1982讨论的是repeated measure model 如何用 EM找MLE,方法很简单,M这一步就是condition on residual以及random effects (对应的sufficient statistics)来求coefficient以及covariance的极值点。而E step就是根据这些极值点带回去求得residual和random effects,再算出需要的sufficient statistics的期望。Jennrich 1986的paper,讨论了更广泛的model,response的covariance matrix有各种特殊的形式,甚至可以是unstructured (注意无论是random effects model, missing data, 还是factor model都可以求出y的marginal distribution,看其covariance matrix都一般有特殊形式)。Jennrich考虑的是对于y marginal distribution如何用牛顿法来最大化,过程就是14楼 觉即不随 童鞋描述的牛顿法。注意Hessian matrix和fisher scoring的区别是后者用了前者的期望。
回复

使用道具 举报

🔗
superddt 2014-1-14 04:29:54 | 只看该作者
全局:
EM的优点是,如果可以巧妙的地构造一个latent variable,使得我们已有的variable 与latent variable 放在一起就可以构成一个much simpler的情况。从而简化或者转化一个估计的问题。
如果构造的latent variable没能够得到更简单的问题,那EM的优点就不明显了。
Newton method有很多变型,modified newton,quasi-newton之类的方法或者来解决 indefinite hessian或者limited memory的问题。. 1point 3 acres
如果model是exponential family的,那么fisher scoring和直接用hessian matrix的牛顿法是等价的。
回复

使用道具 举报

🔗
ZYYYZ 2014-1-19 13:36:21 | 只看该作者
全局:
本帖最后由 demonhunter 于 2014-1-19 13:49 编辑

谢K大妈的干货。
其实因为mixed effect model的model assumption中random effect是有distribution的所以很自然就可以plug in到Bayesian中,因为这等于给定了random effect的prior。之后如果想研究random effect只需要研究它的posterior就可以了。

哥大的教授Gelman写的:
Data Analysis Using Regression and Multilevel/Hierarchical Models

这本书介绍的很详细
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

>
快速回复 返回顶部 返回列表