注册一亩三分地论坛,查看更多干货!
您需要 登录 才可以下载或查看附件。没有帐号?注册账号
x
AGI组,面试小哥在德国,岗位在东岸。没有LC没有问任何coding和BQ,两天了还没下一轮不确定是否挂掉了
第一部分,先问了chain of thought,恰巧是我做的最少的部分, 问我cot和普通rag的区别,和agent的区别,我没准备这部分,这块的工作经验是application,我做什么research,答得不好,但他主动补充了他的理解,提到cot根据llm的self reflection做planning,我意识到我说漏了
第二部分project dive deep,问了我训练Multimodal的经验,我讲述完项目他表示很感兴趣,然后是三个followup,第一,为什么在vision encoder部分我用了contrastive learning,我说简单label我们试过不好,所以加入了text description结合了metadata做label效果变好了
第二问训练的时候deep speed和megaton你比较一下,我说M有tensor 并行,FF和attention都tensor并行,因为我的MM很大,而且结合sequence并行inference速度才提起来。他马上问不用pipeline并行么?我说我试过pipeline对M M没有任何效果,然后解释了macro batch和bubble time为什么减。然后第三问了Megatr您好! 本帖隐藏的内容需要积分高于 188 才可浏览 您当前积分为 0。 使用VIP即刻解锁阅读权限或查看其他获取积分的方式 游客,您好! 本帖隐藏的内容需要积分高于 188 才可浏览 您当前积分为 0。 VIP即刻解锁阅读权限 或 查看其他获取积分的方式
整个过程很友好,不picky也很尊重我的思路,但我总觉得是不是我按我思路讲太多了而他的followup我回答的却不太好,如果挂了只能是这个原因了。项目dive deep显然他全在线,听的很仔细,有时回一句makesense应该知道我背景是match的吧,不知道是否会过,cross finger…
|