<
查看: 1565| 回复: 3
收起左侧

[其他] 弱弱的问一个关于状态空间的问题

superwangxp | 显示全部楼层
本楼:   👍  0
0%
0%
0   👎
全局:   115
99%
1%
1

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x
一直这块有点纠结。。。
比如说有三个状态参数cpu, memory, disk。那n个节点的状态空间就是
(cpu1,mem1,disk1,... , cpun, memn, diskn)?是一个向量?这个状态空间到底是什么意思?计算时怎么把它看做一个整体?

关键的地方是,如果状态空间increase dramatically, 用reinforcement learning方法研究时系统性能为什么会急剧下降?

我觉得学统计的人应该比较懂吧。。. ----

多谢多谢啦。。

上一篇:学accounting,marketing和finance的顺序
下一篇:美国失业率27州升高7州下降
parachutemd 2010-3-27 12:57:38 | 显示全部楼层
本楼:   👍  0
0%
0%
0   👎
全局:   197
90%
10%
23
I think it could be interpreted as 3 dimensional vector. Every attribute is considered as one dimension. Reinforcement learning is about to find a balance between what is known and what is unknown. It collects consequences of unknown actions. If the number of samples increase dramatically, the learning process would be much more complicated.
回复

使用道具 举报

 楼主| superwangxp 2010-3-27 23:39:17 | 显示全部楼层
本楼:   👍  0
0%
0%
0   👎
全局:   115
99%
1%
1
RL说白了不就是多次反馈然后达到满意的值吗?或者叫最优值跟踪?
那我有三个参数,为什么随着节点数的增加,学习的过程会变得越来越复杂?从数学上怎么说?
回复

使用道具 举报

 楼主| superwangxp 2010-3-28 00:45:01 | 显示全部楼层
本楼:   👍  0
0%
0%
0   👎
全局:   115
99%
1%
1
sigh。。。看来还是放到统计办也许会好些哈。。。

还有,我们学MDP过程时,一个状态空间不就是描述成{1,2,3,4},然后一次状态转移矩阵就是个4X4的吗?.1point3acres
换到RL里,这个就不解了。。sigh。。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

Advertisement
>
快速回复 返回顶部 返回列表