《数据科学面试40+真题讲解》,K神本年度最后一次开课


一亩三分地论坛

 找回密码
 Sign Up 注册获取更多干货
码农求职神器Triplebyte:
不用海投,内推你去多家公司面试
Airbnb 数据科学职位
in analytics and inference
天天打游戏、照样领工资,
你要不要来?
把贵司招聘信息放这里
查看: 441|回复: 0
收起左侧

[统计生统] 【问题讨论】关于regression的时序性的疑惑

[复制链接] |试试Instant~ |关注本帖
y5yeyey 发表于 2015-9-22 01:00:11 | 显示全部楼层 |阅读模式

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?Sign Up 注册获取更多干货

x
小弟目前遇到一个关于Linear model的小问题,抛在地里请教各位,拜谢!

如果算伸手党,我道歉。只好怨自己统计基础不扎实,先行谢过!. From 1point 3acres bbs

数据:
(response Y, predictor variable X, dummy variable D; Y - continuous, X - continuous, D = 0 or 1 )

data.frame:
date Y  X  D
20150101 123   321  0
20150102  231   223   1
......
20150921  222  223  1
20150922  ?   424  0

已知 X 随时间的分布,是完全非线性的。

目的是预测出第二日的Y,如上图所示。其中第二日的 X 和 D 均已知,如预测 20150922 的 Y。每日的 Y 均与其之前三天的 X 相关,如 20150403 的 Y 与 20150403、20150402 和 20150401 的三个 X 都相关。

那么,对于每一个 Y ,建立三个 predictor vairable X_1, X_2, X_3,即使它们三个都是同一个predictor variable。


两个问题:


1. 即:fit model as: Y ~ X + D + cross term  OR  Y ~ X_1 + X_2 + X_3 + D + cross term ? 鏉ユ簮涓浜.涓夊垎鍦拌鍧.

以前 regression analysis 上课时没有遇到过类似的问题。我认为即使 X_1,2,3 linearly independent, 但是这样去 fit model 还是很奇怪的一件事,但是说不出来哪里有问题。. from: 1point3acres.com/bbs

2. 如果认为把 X 拆分为 X_1,2,3 是考虑进了时间的影响,那么基于 regression model Y ~ X + D + cross term,有其他方法去加入时间的因素吗?

. 鍥磋鎴戜滑@1point 3 acres
感谢大家!勿见笑!
鏉ユ簮涓浜.涓夊垎鍦拌鍧.

本版积分规则

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2017-11-20 22:07

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表