📣 VIP通行证夏日特惠 限时立减$68
查看: 3289| 回复: 19
跳转到指定楼层
上一主题 下一主题
收起左侧

[职场感言] 我球球你们了 meta出租算力就是郑智豆蒸

全局:

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x
本帖最后由 微信用户_a74b39d 于 2026-7-2 11:27 编辑
. 1point 3acres
尤其是dpsk 又整了个DSpark的狠活  speculate decoding开始搞蒸馏了  这玩意gpu hours 哔哔哔的涨  

meta就是搜广推旧时代业务声音太大勒 gpu宁可给外边黄毛霍霍也不上多模态

上一篇:On-site面试后一周没有消息,要去催拒信吗
下一篇:小扎估计说了句真话:AI 淘金,掏出来的金子还不够还买铲子的钱,不如把铲子租出去
地里匿名用户
推荐
匿名用户-DVKDU  | 添加认证 | 5 小时前
匿名用户 发表于 2026-7-2 09:40. 1point 3 acres
TBD除了把业界薪水提上去还做什么特别贡献? 早知道弄一年也就是个半吊子那还不如一开始就让FAIR去搞, 甚至 ...

不研究自研模型,就相当于一个强国没有自己的原子弹。
那只能被拿捏。所以,一定要搞。而且小札要搞super intelligence,不可能用其他公司的模型。. .и

问题是自研模型怎么搞。他走的路是TBD,天价挖人想短期放卫星。. 1point3acres
. 1point3acres.com
DeepSeek估值500亿美元,月之暗面200亿美元。买一个团队也许更好。就是中国的买不了。
回复

使用道具 举报

地里匿名用户
推荐
匿名用户-VYJAW  | 添加认证 | 半小时前
本帖最后由 匿名 于 2026-7-2 13:37 编辑

纯好奇, 买它妹干的了这种oncall的粗活吗,而且如果有实打实的external customer,oncall跟aws似的起不要革命了
回复

使用道具 举报

地里匿名用户
推荐
匿名用户-DVKDU  | 添加认证 | 3 小时前
本帖最后由 匿名 于 2026-7-2 12:01 编辑 . 1point3acres

对于是否一定要自研大模型,好像大家都觉得没必要。APPLE不用自研,是因为它自己有硬件平台入口。. 1point3acres

1. 大模型和比特币,元宇宙不是一个概念。大模型是验证过的路线。
2. 大厂没有自己的大模型就要被卡脖子。如果对方提价怎么办?你的数据要不要融入到对方的大模型里?你用户的数据给对方有没有隐私安全问题?对方看你赚钱眼热,不给你用了怎么办?对方给你偷偷降级了怎么办?你的业务量大了,对方支持不了怎么办?。。。
3. 开源模型的performance差很多。中国的开源模型好(也许蒸馏的),但是你敢把主要业务压上去吗?懂王一个命令你就歇菜了。而且开源模型停更怎么办?好的开源模型能让你这美国大厂免费用?开源模型依然是卡脖子啊。大家仔细看看license
回复

使用道具 举报

地里匿名用户
🔗
匿名用户-0FJRM  | 添加认证 | 昨天 23:34
有没有可能是内部模型质量不够
外边模型不可以用,还不如原来的老路子

而且latency也够不上吧
回复

使用道具 举报

地里匿名用户
🔗
匿名用户-5AWDQ  | 添加认证 | 5 小时前 来自APP
Chris cox 干不过 山大王
回复

使用道具 举报

全局:
匿名用户 发表于 2026-7-2 11:34
有没有可能是内部模型质量不够
外边模型不可以用,还不如原来的老路子

. 1point 3 acres拿去糊弄agent 足够勒
回复

使用道具 举报

地里匿名用户
🔗
匿名用户-SJYXT  | 添加认证 | 5 小时前
TBD除了把业界薪水提上去还做什么特别贡献? 早知道弄一年也就是个半吊子那还不如一开始就让FAIR去搞, 甚至连FAIR都不需要, 直接拿开源不完了. 投资那么多DC连个响都没听到, 把其他部门折腾够呛. 其他公司没有自研模型是不过了还是怎么着
回复

使用道具 举报

地里匿名用户
🔗
匿名用户-DVKDU  | 添加认证 | 5 小时前
"尤其是dpsk 又整了个DSpark的狠活  speculate decoding开始搞蒸馏了  这玩意gpu hours 哔哔哔的涨  "

dpsk是啥?一个VP?
speculate decoding 蒸馏谁?
回复

使用道具 举报

地里匿名用户
🔗
匿名用户-SJYXT  | 添加认证 | 5 小时前
匿名用户 发表于 2026-7-2 10:00
不研究自研模型,就相当于一个强国没有自己的原子弹。
那只能被拿捏。所以,一定要搞。而且小札要搞supe ...
.--
真搞笑, 没有自研模型的大厂占绝大多数, 又不是什么毁天灭地的技术, 开源随便抓一个就行了, 反正都是互相蒸馏的产物, 谁还不知道这点破事
回复

使用道具 举报

全局:
匿名用户 发表于 2026-7-2 12:48
"尤其是dpsk 又整了个DSpark的狠活  speculate decoding开始搞蒸馏了  这玩意gpu hours 哔哔哔的涨  "
. 1point3acres
d ...

dpsk--deepseek
DSpark 是拿原 target model 的输出/hidden states 做 teacher,然后训练一个小 drafter/draft module 来猜未来 token。
回复

使用道具 举报

地里匿名用户
🔗
匿名用户-CQB7Z  | 添加认证 | 4 小时前
匿名用户 发表于 2026-7-2 10:00
不研究自研模型,就相当于一个强国没有自己的原子弹。
那只能被拿捏。所以,一定要搞。而且小札要搞supe ...

"不研究xxx,就相当于一个强国没有自己的原子弹"
可以把 xxx 换成 加密货币、元宇宙 etc. 🐶
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
职场达人
  • ↑ 本版用于讨论职场各种干货话题,闲聊请去🔗聊聊或者🔗匿名版
  • ❌ 本版严禁水贴,引战,发布广告,拉群,贴个人联系方式,扣分无警告
  • ☑ 求职、面经等去 🔗北美求职和 🔗回国求职大区,刷题和学习请去 🔗终身学习大区
  • ☑ 请去专版发布 🔗内推, 🔗招聘信息,和讨论 🔗创业内容
  • ☑ PIP / DevList/ Need Support 等话题也已开设 🔗专版

本版积分规则

>
快速回复 返回顶部 返回列表