查看: 6421| 回复: 12
收起左侧

太强了!ChatGPT o1写代码的逻辑比Claude 强很多

 
本楼:   👍  6
100%
0%
0   👎
全局:   866
94%
6%
53

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x
虽然Claude 编程能力排名最高,但是推理能力貌似差一点,从live bench的得分可以看出来。所以复杂问题的编程方面,GPT o1明显更厉害。
我输入我的meeting scheduling 网站wenizoka的文件,总共9k tokens,让他实现复杂的新功能,如图,就是在日历里显示每个人的选择。o1能很顺利地完成,而且,得益于他65k token的超大输出能力,他直接把所有脚本都打印出来。
Claude Sonnet 3.5就明显吃力,总是出错,而且只有8k token 的输出,经常输出一半就停了。
我还试过了Gemini Pro 1.5和他的Flash 2.0,挺差劲的说实话。
总之,o1太强了。

F2370C91-B143-4596-B4A6-728F2BD1058B.jpg

E3FB3183-064E-4FC4-BB04-BFAC8B1F64DF.jpg

上一篇:我超级喜欢用NaturalReader 来听书
下一篇:Github Copilot今天起开始免费了
ND0406 2024-12-15 04:40:47 来自APP | 显示全部楼层
🤗 2
本楼:   👍  10
100%
0%
0   👎
全局:   11468
95%
5%
660
坐标亚麻 我使用chatgpt我感觉自己比组里面的一些L7都强了(也许错觉 🤣

深以为chatgpt要取代的不是Junior码农,而是取代那些假大空的PE 甚至senior pe,一天天在design doc上放屁
回复

使用道具 举报

FibonacciX 2024-12-14 23:09:15 | 显示全部楼层
🤗 1
本楼:   👍  4
100%
0%
0   👎
全局:   391
67%
33%
196
我实名付费了一个月的Gemini pro,还没用楼主这么高大上的任务功能,就是一些简单文档归纳总结提炼翻译,和一些相对不那么复杂的数学计算。显然Gemini pro和ChatGPT的输出结果比较,Gemini pro差了一大截,但monthly subscription上两者也差不太多。我就不明白Google是怎么沦落到今天,且还有脸跟ChatGPT同一个收费量级的。ChatGPT现在也不完美,很多我上述的任务执行时,也能明显感觉到对我的命令理解不够明白,很多时候给一般性回答,但其输出稳定性可以说秒杀Gemini pro,而且能满意的完成我70% - 80%的指令。
Claude 没试过。不知道有没有付费版,欢迎有经验的朋友过来评价下
回复

使用道具 举报

FibonacciX 2024-12-15 04:32:04 | 显示全部楼层
本楼:   👍  2
100%
0%
0   👎
全局:   391
67%
33%
196
duncankkc 发表于 2024-12-14 12:27
我特别特别好奇,我自己用gemini也是非常非常差,真的很烂,跟claude和chatgpt完全不是一个量级,但是goog ...

我的感觉是google在AI竞争赛道上算是废了,我猜背后反映出来的问题是google 的corporate culture和pay对于顶尖AI人才来说,比较其竞争对手太没有吸引力了。尤其是最近Open AI开这14天的新品发布会,把很多Productivity tools 的功能和特征整合进了ChatGPT,以后一定会增加用户粘性和使用时长的。Gemini pro 更废了

倒是Claude还没有机会领教过。兄弟,你用过吗?给点评价啊
回复

使用道具 举报

aHeliz 2024-12-14 09:43:47 | 显示全部楼层
本楼:   👍  1
50%
50%
1   👎
全局:   620
94%
6%
39
你高兴就行
回复

使用道具 举报

zzhlp 2024-12-14 10:09:07 | 显示全部楼层
本楼:   👍  1
100%
0%
0   👎
全局:   72
89%
11%
9
哇 厉害诶 我也试试
回复

使用道具 举报

kirska 2024-12-14 17:06:03 | 显示全部楼层
本楼:   👍  1
100%
0%
0   👎
全局:   2675
97%
3%
75
O1的速度对比过吗。。。
回复

使用道具 举报

duncankkc 2024-12-15 00:27:58 来自APP | 显示全部楼层
本楼:   👍  1
100%
0%
0   👎
全局:   696
97%
3%
19
FibonacciX 发表于 2024-12-14 07:09:15
我实名付费了一个月的Gemini pro,还没用楼主这么高大上的任务功能,就是一些简单文档归纳总结提炼翻译,和一些相对不那么复杂的数学计算。显然Gemini p
我特别特别好奇,我自己用gemini也是非常非常差,真的很烂,跟claude和chatgpt完全不是一个量级,但是google在AI这方面感觉新闻和各种评测都吹的遥遥领先。想知道是不是我的问题,还是真的是google在新闻上吹的太大了,如果是后者真的想看他泡沫破的那天,gemini使用体验实在是太烂了
回复

使用道具 举报

W_S_W 2024-12-15 10:57:23 | 显示全部楼层
🤗 1
本楼:   👍  1
100%
0%
0   👎
全局:   8
89%
11%
1
ND0406 发表于 2024-12-14 12:40
坐标亚麻 我使用chatgpt我感觉自己比组里面的一些L7都强了(也许错觉 🤣

深以为chatgpt要取代的不 ...

歪个楼问下层主这里说的PE指的是?谢谢
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

Advertisement
>
快速回复 返回顶部 返回列表