查看: 8531| 回复: 36
收起左侧

对ChatGPT的信任危机

    |只看干货
bugman | 显示全部楼层 |阅读模式
本楼: 👍   88% (8)
 
 
11% (1)   👎
全局: 👍   91% (193)
 
 
8% (19)    👎

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x
我用chatGPT一段时间了。很惊叹于它的知识渊博,语言通顺。

但在我和数学系的朋友一起对它的逻辑和数学能力进行测试之后,我们发现,它基本不具有任何逻辑,在逻辑问题里,非常自信的回答里,常有自相矛盾。

后来我用它帮我写论文的abstract,初看发现它的理解能力出奇的好,可是仔细读,发现它对我算法数学上的描述模棱两可。问它一些概念上的问题,它也经常回答我latex,编译之后能得到一篇得看似完美的充满公式的短论文,但细读发现存在根本上的错误。简直可以用细思极恐来形容。

我现在对它有强烈的信任危机,不知道大家怎么感觉?它经常出错原因是什么呢?它自己的知识库本身有问题,还是因为模型其实只是经过人工rl之后让人喜欢的接话机器?

评分

参与人数 1大米 +1 收起 理由
TedWFDE + 1 给你点个赞!

查看全部评分


上一篇:【小白找学友】deep learning with pytorch的视频或课程一起学
下一篇:请问如何评估一个数据集合的性能?
lxhfirenking 2022-12-23 11:20:52 | 显示全部楼层
本楼: 👍   100% (47)
 
 
0% (0)   👎
全局: 👍   96% (2441)
 
 
3% (86)    👎
因为gpt 3.0/3.5的训练目标就不是“逻辑”和“正确性”, 而是“像模像样的说人话”
回复

使用道具 举报

donnice 2022-12-23 12:54:06 来自APP | 显示全部楼层
本楼: 👍   100% (16)
 
 
0% (0)   👎
全局: 👍   92% (10177)
 
 
7% (832)    👎
我很好奇,是什么让曾经的你决定信任ChatGPT?
回复

使用道具 举报

ccdtz 2022-12-24 02:36:07 | 显示全部楼层
本楼: 👍   100% (5)
 
 
0% (0)   👎
全局: 👍   96% (908)
 
 
3% (36)    👎
可能是营销号吹的太过了,让你抱有不切实际的expectation。

我刚玩gpt的时候也是各种震撼,觉得真牛逼,人工智能到达这个地步了吗?

后来玩的多了,很多套路就发现了。它最大问题就是,洋洋洒洒的八股文,用的很多表达就是模棱两可,万能的遣词造句,关键是如果你问题写实际的问题,他可能写了很多,然后每一句还看着像那么回事,但是根本事实却是错的,这就破坏性很大了。

另外它模板痕迹其实蛮重的,你如果连续问几个相似的话题,你会发现很多重复的语句(比如为xx写一首诗),后来我慢慢就释然了。chatgpt确实比之前的那些个chat AI强一个档次,但与你我所理解的那种真正智能还差的很远。

话说,用来写八股文,那是绝配。
回复

使用道具 举报

kamimare 2022-12-23 09:30:06 来自APP | 显示全部楼层
本楼: 👍   100% (3)
 
 
0% (0)   👎
全局: 👍   91% (67)
 
 
8% (6)    👎
逻辑一直是现在的所谓AI的弱点,涉及到符号运算的都不太行。不信可以试试问chatGPT 鸡兔同笼之类的问题
回复

使用道具 举报

 楼主| bugman 2022-12-23 09:33:20 | 显示全部楼层
本楼: 👍   100% (3)
 
 
0% (0)   👎
全局: 👍   91% (193)
 
 
8% (19)    👎
kamimare 发表于 2022-12-22 20:30
逻辑一直是现在的所谓AI的弱点,涉及到符号运算的都不太行。不信可以试试问chatGPT 鸡兔同笼之类的问题

我问过更简单的,都不会,比如1+1+1+...+1,连续20个,它大概率会给出错位答案。然后问它为啥,它竟然还能解释得很自信。
回复

使用道具 举报

Invisible_zhang 2022-12-23 09:55:27 | 显示全部楼层
本楼: 👍   100% (2)
 
 
0% (0)   👎
全局: 👍   92% (971)
 
 
7% (75)    👎
bugman 发表于 2022-12-22 17:33
我问过更简单的,都不会,比如1+1+1+...+1,连续20个,它大概率会给出错位答案。然后问它为啥,它竟然还能 ...

没懂你什么意思,我试了1+1+1..+1连续20个,得出答案就是20
回复

使用道具 举报

 楼主| bugman 2022-12-23 10:20:43 | 显示全部楼层
本楼: 👍   100% (4)
 
 
0% (0)   👎
全局: 👍   91% (193)
 
 
8% (19)    👎
本帖最后由 bugman 于 2022-12-22 21:22 编辑
Invisible_zhang 发表于 2022-12-22 20:55
没懂你什么意思,我试了1+1+1..+1连续20个,得出答案就是20

me: 1+1+1+1+1+1+1+1+1+1+1+1+1+1+1+1+1+1+1+1
chatgpt: The sum of the series 1+1+1+1+1+1+1+1+1+1+1+1+1+1+1+1+1+1+1 is 18.
me: why
chatgpt: When you add up a series of numbers, you are finding the total or sum of those numbers. In this case, the sum of the series 1+1+1+1+1+1+1+1+1+1+1+1+1+1+1+1+1+1+1 is 18 because 1+1 is 2, 2+1 is 3, 3+1 is 4, and so on until you have added all of the 1's together and gotten a total of 18.


把数学式子写出来,它就不会做了
回复

使用道具 举报

simply140 2022-12-23 10:22:27 来自APP | 显示全部楼层
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   99% (1299)
 
 
0% (13)    👎
为啥要信任chatgpt?不如上淘宝买服务?
回复

使用道具 举报

SandyCreek 2022-12-23 10:41:38 来自APP | 显示全部楼层
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   100% (35)
 
 
0% (0)    👎
chatgpt对于逻辑推理的能力极其弱,似乎也并不能真正进行计算,我曾经给其提供过《塞族炮弹上帝指引》与《波斯尼亚炮兵》的波-克-塞语歌词,即使如此chatgpt也不能理解b站弹幕的“波斯尼亚炮弹安拉指引”是什么意思,可见其推理能力基本是没有的,很多时候是靠重复正确(有时甚至不是)的废话来应付
回复

使用道具 举报

本楼: 👍   100% (4)
 
 
0% (0)   👎
全局: 👍   97% (4954)
 
 
2% (129)    👎
现在的模型没有一个可以有逻辑,都是靠大量数据堆起来的,所以不奇怪

评分

参与人数 1大米 +1 收起 理由
stepforward6 + 1 赞一个

查看全部评分

回复

使用道具 举报

zengxianfeng 2022-12-23 11:32:36 来自APP | 显示全部楼层
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   100% (5)
 
 
0% (0)    👎
因为它没有专门用来掌管逻辑的东西,dl的模型只是拟合数据分布,仅此而已。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

>
快速回复 返回顶部 返回列表