导读
Guide
解锁权限
功能中心
话题
求职
攻略
帮助
搜索
⌘
Ctrl
k
站内搜索(扣大米)
Instant搜索
Google搜索
权限解锁
登录
注册
首页
论坛
Offer多多
Job多多
Salarytics
Visa Tracker
新冠疫情
交友
Instant
精品网课
生活攻略
手机APP
商务合作
维权
<
登录
注册
升级
关注
扫码关注一亩三分地微信公众号
一亩三分地Warald
一亩三分地华人生活
一亩三分地求职移民
一亩三分地海外投资
帮助
TOP
每日签到
置顶话题
最新回复
最新主题
最新热门
获取积分
新手指南
淘贴
我的订阅
我的帖子
VIP通行证
购买蓝莓
企业招聘广告
移民律师专栏
洽谈其他合作
道具[匿名/删除/提升/关闭/等]
考试
附件
勋章
许愿墙
去广告
面试辅导
全民竞猜
每日签到
每日答题
超级匿名
微信解绑
话题
学校
公司
地区
证券
求职辅导匹配
DS501 数据科学面试40+真题讲解
瞄准秋招:暑假跟着Shawn老师刷题!
DS601 AB Test从入门到精通
CS601 谷歌工程师讲系统设计
DS401 资深数据科学家教你破解DS面试
CS401 谷歌招聘委员会成员讲解如何准备面试
DS402 Resume Workshop
DS401A 模拟面试-数据科学
DS404B 模拟面试-机器学习
CS404A 模拟面试-算法
CS404B 模拟面试-系统设计
锦晖律师事务所H1B签证申请讲座
CS入门攻略
CS求职攻略
PM求职攻略
系统设计攻略
数据科学攻略
回国礼物礼品最全清单
如何在新城市快速省心安家
车盲如何购买二手车
收到医院的天价账单怎么办
更多
苹果应用商店
谷歌应用商店
百度网盘apk
商务合作
常见问题
新手上路
App下载
帖子
投票
活动
版块
群组
日志
用户
一亩三分地
»
论坛
›
专业技术
›
技术交流
›
机器学习
›
LLM 实用 insights 分享
返回列表
查看:
1600
|
回复:
1
LLM 实用 insights 分享
机器学习
polarcat2
当前离线
主题
帖子
176
积分
中级农民
积分
176
大米
颗
鳄梨
个
水井
尺
蓝莓
颗
萝卜
根
小米
粒
学分
个
注册时间
2022-11-20
最后登录
1970-1-1
狗仔卡
polarcat2
2025-5-12 11:49:25
|
显示全部楼层
本楼:
👍
1
100%
0%
0
👎
全局:
208
100%
0%
1
注册一亩三分地论坛,查看更多干货!
您需要
登录
才可以下载或查看附件。没有帐号?
注册账号
x
本帖最后由 polarcat2 于 2025-5-11 20:50 编辑
分享这个五月刚出不久的video:
https://www.youtube.com/watch?v=NHMJ9mqKeMQ
个人觉得非常实用. 比如:
Fine-tuning 也可以用来将知识融入模型权重,但这可能导致过拟合和幻觉增加。并且一旦知识固化在权重中,更新会变得困难。相比之下,
上下文记忆更容易更新。通常,RAG 比持续 Fine-tuning 成本更低。
(个人觉得Fine-tuning 比RAG inference 时会快一些, 但RAG更实用,更容易Adapt)
对于处理数十亿 token 的大规模知识库(如企业知识库),RAG 仍然是必需的。
长上下文并不会取代 RAG,而是会协同工作。
长上下文允许模型容纳 RAG 检索到的更多相关信息,这有助于提高有用信息的召回率。
生成思维轨迹(generate a thinking trace)之所以有效,是因为它
允许模型超越其网络深度在一单次处理中的限制
,通过利用自身生成的输出来构建理解,并执行更复杂的逻辑步骤,从而能够解决单靠模型内部处理难以解决的任务
如果模型需要依赖上下文记忆而非权重记忆(例如更新过时信息),应通过 Prompt 明确指示,如使用
“基于以上信息”
之类的短语,以解决潜在的冲突或歧义
分享给大家。希望有用。希望加些大米。感谢各位老板!
上一篇:
最容易起步的 facial expression + eye tracking + voice classification
下一篇:
UCI CS的同学回中国可以用学校的VPN远程工作吗?
相关帖子
向量与语义
Deep Learning 圣经第一部分总结 📚
关于"Recommender Systems" 推荐系统设计的学习准备资料分享【欢迎大家接龙】
小白请教一个和语言模型有关的问题
Machine learning performance/MLSys
CMU ECE选课-AI track 求推荐
UCI CS的同学回中国可以用学校的VPN远程工作吗?
最容易起步的 facial expression + eye tracking + voice classification
推荐系统小项目
请问2025年比较推荐的AIML的学习路径是什么呢?
2025 Q1 Recsys Paper Summary
分享 ML design 推荐系统
图像处理特刊征稿
ML/LLM system design 学习资料
2025 NVIDIA GTC大会 学习笔记
AI这波会是泡沫吗?PHD还是SDE还是MLE?
Gen AI specialist 工作内容
Star Attention 学习分享
Machine Learning System Design模板/example & 手撕经典算法
机器学习论文阅读群
回复
使用道具
举报
提升卡
置顶卡
关贴卡
开贴卡
变色卡
千斤顶
igp2bgp
当前离线
主题
帖子
298
积分
中级农民
积分
298
大米
颗
鳄梨
个
水井
尺
蓝莓
颗
萝卜
根
小米
粒
学分
个
注册时间
2019-11-10
最后登录
1970-1-1
狗仔卡
igp2bgp
2025-5-12 12:43:29
来自APP
|
显示全部楼层
本楼:
👍
0
0%
0%
0
👎
全局:
172
93%
7%
13
有人说rag converge 很慢,不如mcp, 当然 tool 要写的够好,且llm 能支持 tool calling.
回复
支持
反对
使用道具
举报
返回列表
B
Color
Link
Quote
Code
您需要登录后才可以回帖
登录
|
注册账号
隐私提醒:
☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗
同学同事飞友
,拉群请去🔗
拉群结伴
,广告请去🔗
跳蚤市场
,和 🔗
租房广告|找室友
☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
☑ 干货版块可免费使用 🔗
超级匿名
:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
☑ 查阅全站 🔗
各种匿名方法
本版积分规则
发表回复
回帖后跳转到最后一页
我是之前出柜被软禁的楼主,和大家更新一下近况
全职SDE和Contractor薪资福利,工作状态对比
内窥MLE:你需要的技能
月嫂离开一个多星期,来分享一下这段时间的感受
意大利旅游:重归威尼斯Venice/Venezia系列3/3深度技术攻略
意大利旅游:重归威尼斯Venice/Venezia系列2/3深度技术攻略
意大利旅游:重归威尼斯Venice/Venezia深度技术攻略1/3
美股:也許可以看看另一條路
【找工记录 + 求助】MLE 求职太难了,希望抱团取暖
【长篇连载】燃星坠地 Vol.1 - 第一章:校园
生活攻略
更多 >
第一次组装游戏PC?不要惊慌,本指南可以帮
新年礼物推荐 Amazon急速送达 来这里找
美国养老问题:各州政策、医疗保险、养老机
在美国做近视激光手术LASIK经验分享(
【超全】适合携带的防身物推荐!以及家中必
>
论坛导航
快速回复
返回顶部
返回列表