查看: 573| 回复: 0
跳转到指定楼层
上一主题 下一主题
收起左侧

[数组] R/Python数据处理的问题

全局:

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x
有一个表格df1,包括id, t, dm, s这4列。其中
* id有重复。这里只列出id = 1,2的情况,但是真实数据中还有很多,id=1,2,...,100.
* t可以理解为时间,1-7天,或者1-7月等等。
* dm是另一个参数,要根据dm做一些lag。
* s是一些数值。

df1



根据这些来计算df2中x的值。具体算法如下:
当id = 1时,dm = 1。x的值比s的值滞后(lag)一行。
当id = 2时,dm有两个值(2和3)。
  • 当dm = 2时, x的值比s的值滞后(lag)两行。
  • 当dm = 3时, x的值比s的值滞后(lag)三行。

其中第12行的x值为0

df2



这个如何实现呢?就是说应该如何产生x列。

我已经试过left join,shift等办法,都没有搞定。









评分

参与人数 1大米 +3 收起 理由
14417335 + 3 给你点个赞!

查看全部评分


上一篇:R/Python问题
下一篇:今天面试某FAANG厂被问了一道多叉树的题非递归
您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

>
快速回复 返回顶部 返回列表