回复: 2
跳转到指定楼层
上一主题 下一主题
收起左侧

字节算法面经

全局:

2025(10-12月) MachineLearningEng 硕士 全职@微软中国 - 网上海投 - 视频面试  | Pass | 应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x
  • PPO和DPO的原理
  • PPO的actor和critic的优化目标分别是什么
  • actor和critic的区别是什么
  • value function和reward function的区别是啥
  • 分别说一下one sug/one rec/hstu的区别是什么
  • onerec在多模态方面的应用
  • codebook的作用

上一篇:微软2026Applied Scientist面经
🔗
 楼主| 微信用户_g9cp4 2026-4-17 23:55:53 来自APP | 只看该作者
全局:
新人求米!!
回复

使用道具 举报

🔗
润无声 2026-5-22 19:36:34 | 只看该作者
全局:
问一下有刷题吗
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

>
快速回复 返回顶部 返回列表