查看: 843| 回复: 2
收起左侧

如何高效的做实验管理

  |只看干货
Like999 | 显示全部楼层 |阅读模式
本楼: 👍   100% (8)
 
 
0% (0)   👎
全局: 👍   91% (21)
 
 
8% (2)    👎

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x
作为机器学习方向中偏application的cs phd, 在此总结自己这几年empirical work的一些血泪经验教训。
恰逢刚熬夜赶完ICML,至少希望自己以后可以更加高效,以避免因没存model ckpt, 没存好对的结果paper中画图需重跑等等问题。

简单来讲就是写paper的时候,需要呈现在paper里的图或者表的各种数据要非常easy get.
具体来讲就是以下几点:


  • 开始做好实验设计,确认好 数据处理 (比如data shuffle与否差别很大),模型选择,结果输出保存格式是否principal且高效
  • 加速实验debug过程:不要上来就上完整数据和大model,最开始用少量数据和小的model 来debug。同时如果能并行去并行跑多个。
  • 保存model 参数设置,尤其是最优性能或者出现在paper里的结果对应的参数,最好做成开始就做成要出现在paper里的图表
  • 保存 model checkpoints, 日后很可能需要重新做inference。
  • 保存实验结果,以方便翻来覆去画各种图的读取格式。
  • 及早确定好要出现在paper里的图的final模式,包括legend, title设定放在哪等等细节,因为初始模板定不好会导致后续类似图都要翻新,耽误时间。


欢迎大家分享其他的点!

补充内容 (2023-01-28 03:07 +8:00):
wandb 很好用,实时查看training curve, 结果可以export 成 csv很方便用来画图等等,没用过的同学用了可能会相见恨晚。

做实验不要有逃避偷懒的心理,比如一个实验多数时候需要跑多次over different random seeds 等等,以check结果的可复现性及stability, 很多review会要求report variance over randomness。

另外系统的了解下matlablib plt画图,会在需要的时候快速的选对命令。

评分

参与人数 6大米 +31 收起 理由
L.LawlietSQBR + 1 赞一个
bryanjhy + 25 给你点个赞!
Uirseita1 + 2 很有用的信息!
Jneasy2 + 1 给你点个赞!
asder777aw + 1 赞一个

查看全部评分


上一篇:求MLE面试准备该看哪些书
下一篇:你们说现在nlp的research还有什么搞头?
asder777aw 2023-1-27 17:05:29 来自APP | 显示全部楼层
本楼: 👍   100% (2)
 
 
0% (0)   👎
全局: 👍   98% (86)
 
 
1% (1)    👎
赞赞赞,希望我们的paper都能中!

评分

参与人数 1大米 +1 收起 理由
SeanLu198 + 1 赞一个

查看全部评分

回复

使用道具 举报

Blanche- 2023-1-27 19:25:14 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   93% (27)
 
 
6% (2)    👎
感谢分享!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

>
快速回复 返回顶部 返回列表