回复: 19
收起左侧

亚麻 senior DS GenAI VO 详细面筋

本楼:   👍  5
100%
0%
0   👎
全局:   41
100%
0%
0

2024(7-9月) 分析|数据科学类 博士 全职@amazon - 猎头 - 视频面试  | 😃 Positive 😐 AverageOther | 在职跳槽

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x
- 之前的滇缅面筋链接:https://www.1point3acres.com/bbs/thread-1080248-1-1.html
- 刚面完VO 一个presentation + 5轮,静等结果,不求大米,只攒人品,希望内容能帮到大家。. ----
- 安全起见,加一个20积分的限制,避免被搜索引擎发现

您好!
本帖隐藏的内容需要积分高于 20 才可浏览
您当前积分为 0。
使用VIP即刻解锁阅读权限或查看其他获取积分的方式
游客,您好!
本帖隐藏的内容需要积分高于 20 才可浏览
您当前积分为 0。
VIP即刻解锁阅读权限查看其他获取积分的方式

评分

参与人数 10大米 +20 收起 理由
清道神君 + 10 欢迎分享你知道的情况,会给更多大米奖励!
耐压克骂_12138 + 1 赞一个
Birdring.ow + 1 赞一个
ycai56 + 1 很有用的信息!
zzs1 + 1 给你点个赞!

查看全部评分


上一篇:JP Morgan Data intern OA
下一篇:c1 sda 面精
 楼主| jbdx6308 2024-9-11 04:26:04 | 显示全部楼层
本楼:   👍  3
100%
0%
0   👎
全局:   41
100%
0%
0
北辰一 发表于 2024-9-10 15:25
恭喜楼主拿到offer,可以分享一下你刷题是怎么准备的吗,大概花了多久时间,是按照什么面经刷的吗还是就是t ...

谢谢!
- 关于刷题,leetcode没有专门刷。主要是recuitor跟我说这个岗位不考coding,我就信了。幸好面亚麻前面了tt,所以刷了tt的高频题,手没有生。 然后coding考的不难,就过了。
- BQ的环节 就是参考了地里的帖子,之前有很多总结很好的帖子
- ML 八股。这个网上很有多。一搜一大把。唯一的缺点是很多只有问题,没有解释。可以借助chatgpt。 考虑到这个岗位是做LLM得,现在传统ML在工作上用的越来越少,所以重点就是复习一下一些基本DL模型的结构是什么,特点是什么,优缺点是什么。 我之前主要在准备NLP相关的面试和工作,所以面经参考的是这里:https://github.com/km1994/NLP-Interview-Notes 只有没问题,没有答案。答案好像要扫描里面的二维码加入一个付费群,所以就没弄。直接让chatgpt告诉我答案。. Waral dи,
- LLM 八股, 因为我现在的工作涉及LLM training和fine tuning的比较少,所以很多知识是通过这个链接补上的:https://blog.csdn.net/qq_27590277/article/details/134302000。另外bilibili上有一个up主叫“RethinkFun”,关注度不是很高,但无意中看到了他讲解关于LLM得一些知识,觉得比较清晰,这里也推荐一下。 然后关于agent和RAG一些进阶的用法,因为现在工作有所涉及,所以没有专门复习。不过有一些当时发现的资料应该会有所帮助:
1. https://github.com/langchain-ai/rag-from-scratch/tree/main 这个是langchain自己做的一些例子,基本上包含了所有主流的可以增强准确性的方法,原理都不是很复杂。我面试时很多方法都是借鉴这里面的。然后Bilibili上有一个up主叫 沧海九粟, 做了几期关于这些例子的视频。我当时是先看到他的视频,才发现了这些例子
2. https://python.langchain.com/v0.1/docs/modules/data_connection/  langchain上一个版本的document,虽然是旧版本的,但左边的目录里有列出 做RAG时,每一步的多种方法以及解释。新版本就没有 比如 “Text Splitters”的目录下面就有n中不同方法。可以简单的了解下每一个方法的原理。这样如果对方问 如何处理text时,你就可以直接搬里面的知识。

评分

参与人数 5大米 +6 收起 理由
Oki + 1 赞一个
dreamingcat326 + 1 很有用的信息!
北辰一 + 2 很有用的信息!
byt2015 + 1 给你点个赞!
xiaotuziwanan + 1 很有用的信息!

查看全部评分

回复

使用道具 举报

 楼主| jbdx6308 2024-9-10 06:36:28 来自APP | 显示全部楼层
本楼:   👍  3
100%
0%
0   👎
全局:   41
100%
0%
0
匿名用户 发表于 2024-09-07 20:19:21
帖主如果拿到Offer的话 上来说一下呗
刚收到hr的电话,说过了 聊了下地点和包裹 明天发offer

评分

参与人数 1大米 +1 收起 理由
byt2015 + 1 给你点个赞!

查看全部评分

回复

使用道具 举报

 楼主| jbdx6308 2024-9-8 20:11:45 来自APP | 显示全部楼层
本楼:   👍  2
100%
0%
0   👎
全局:   41
100%
0%
0
匿名用户 发表于 2024-09-07 21:15:15
presentation 部分,对方更关心成本什么意思?你不是技术岗吗?需要你知道多少钱的意思吗?
因为我present的时候说了几种我之前尝试得方法,比较了技术上的优缺点,但cost相关的内容说的不多。 只说了某个方法更cost efficiency。提问时 有几个人关心 为什么这个方法的成本会比其它方法低?在哪个环节会cost会更多一些或者低一些? 之类的
打个比方 做rag的话 为了减少hallucination,提高reterieving docs的相关性 有很多不同的方法。大部分方法要么需要消耗额外的token,要么需要引入额外的模型,要么需要fine tune 模型。有些额外的cost的出在dev阶段 有些额外的cost出在operation阶段。
至于问具体多少钱的问题 最后一轮面bq时 我提到过有一个项目 为了节约成本 从 gpt4o换成了3.5。 然后对方问 那能节约多少? 我没说具体数字 只说3.5当时token cost是4o的 1/10.-baidu 1point3acres

评分

参与人数 2大米 +2 收起 理由
byt2015 + 1 给你点个赞!
xiaotuziwanan + 1 很有用的信息!

查看全部评分

回复

使用道具 举报

地里匿名用户
匿名用户-D1IMB  2024-9-6 11:13:53
本楼:   👍  1
100%
0%
0   👎
好厉害!请问你之前做的就是类似applied scientist吗?感觉面的都很难,对于传统DS来说。
回复

使用道具 举报

 楼主| jbdx6308 2024-9-6 11:57:34 | 显示全部楼层
本楼:   👍  1
100%
0%
0   👎
全局:   41
100%
0%
0
匿名用户 发表于 2024-9-5 23:13
好厉害!请问你之前做的就是类似applied scientist吗?感觉面的都很难,对于传统DS来说。

跟applied scientist有一些重合吧,目前在一家startup做full stack DS,啥都有涉及一点。最近半年主要在做LLM相关的项目,所以就恶补了一些相关知识。
回复

使用道具 举报

tyjssally 2024-9-7 07:18:41 来自APP | 显示全部楼层
本楼:   👍  0
0%
0%
0   👎
全局:   44
94%
6%
3
楼主presentation大概框架是什么样的呢?是之前公司做的东西吗
回复

使用道具 举报

 楼主| jbdx6308 2024-9-7 10:00:31 来自APP | 显示全部楼层
本楼:   👍  2
100%
0%
0   👎
全局:   41
100%
0%
0
tyjssally 发表于 2024-09-06 16:18:41
楼主presentation大概框架是什么样的呢?是之前公司做的东西吗
是最近一个给客户做的项目,隐去了客户的具体信息,专注在项目的技术细节里,主要框架是
-先交代了项目的基础背景,客户的要求和LLM application的整体结构 (3页)
. 1point3acres- 然后针对LLM application里面的技术做一些解释。 比如之前尝试了不同的rag 方案和agent的reasoning framework,每种都解释一下,原理是什么,为什么会尝试这个方法,相互比较一下优缺点,最后使用了哪几种方法,怎么组合在一起并做了哪些调整 (16页).1point3acres
-如何评测 (2页)
-最后讲了一些当前的limitation和我正在尝试的解决方案 (2页). 1point 3acres

当时邮件里没有说presentation具体啥要求,只说45分钟,内容自选。所以这个框架应该是因人而异。 考虑到这个岗位是client facing,我slides整体做的比较high level。一些细节本来想等着qa环节被提问,但好像听众都不是很关心。更关心关于成本,和怎么迭代之类的问题

评分

参与人数 2大米 +2 收起 理由
tyjssally + 1 赞一个
xiaotuziwanan + 1 很有用的信息!

查看全部评分

回复

使用道具 举报

tyjssally 2024-9-8 07:35:33 来自APP | 显示全部楼层
本楼:   👍  0
0%
0%
0   👎
全局:   44
94%
6%
3
jbdx6308 发表于 2024-09-06 19:00:31
是最近一个给客户做的项目,隐去了客户的具体信息,专注在项目的技术细节里,主要框架是
-先交代了项目的基础背景,客户的要求和LLM application的整体结
谢谢楼主分享,非常有用
回复

使用道具 举报

北辰一 2024-9-8 10:40:11 | 显示全部楼层
本楼:   👍  0
0%
0%
0   👎
全局:   1211
96%
4%
57
楼主申请亚麻的岗位就这一个吗,没申请as吗?感觉as的工资是不是更高一点
回复

使用道具 举报

地里匿名用户
匿名用户-VWQ14  2024-9-8 11:19:21
本楼:   👍  0
0%
0%
0   👎
帖主如果拿到Offer的话 上来说一下呗
回复

使用道具 举报

地里匿名用户
匿名用户-4LZDK  2024-9-8 12:15:15
本楼:   👍  0
0%
0%
0   👎
presentation 部分,对方更关心成本什么意思?你不是技术岗吗?需要你知道多少钱的意思吗?
回复

使用道具 举报

 楼主| jbdx6308 2024-9-8 19:40:50 来自APP | 显示全部楼层
本楼:   👍  0
0%
0%
0   👎
全局:   41
100%
0%
0
北辰一 发表于 2024-09-07 19:40:11
楼主申请亚麻的岗位就这一个吗,没申请as吗?感觉as的工资是不是更高一点
AS也申了 当时投了好几个 但只有ds的岗有回复
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

>
快速回复 返回顶部 返回列表