# LLM不会带我们走向AGI，这篇论文解释了原因

**来源**: r/ArtificialInteligence
**作者**: u/HotelApprehensive402
**点赞**: 229 | **评论**: 134
**原文链接**: https://www.reddit.com/r/ArtificialInteligence/comments/1s2z5y0/llms_wont_take_us_to_agi_and_this_paper_explains/

---

## 正文

我这样说已经有一段时间了，这篇最近发表的论文真的把它说得很清楚

https://arxiv.org/abs/2603.15381

主要观点很简单

LLM在训练后实际上并不学习

它们只接受一次海量数据的训练，之后我们做的所有事情，如提示、微调或RAG，都只是让一个固定系统表现得更好，而不是真正学习

它们不会从现实世界的经验中更新自己

它们不会建立进化的理解

它们没有自主的持续学习

我认为这是核心限制

论文将其与认知科学联系起来，基本上说真正的智能需要能够从交互和经验中进行自主持续学习的系统，而不仅仅是更好地预测下一个token

现在LLM是优秀的工具

但它们是冻结的知识库，将智能简化为模式匹配

我不认为扩大规模或更多数据会解决这个问题，因为它不在架构中

除非我们构建能够在线学习的系统，否则我们会达到上限

真正的问题是：替代方案是什么？

人类智能通过交互、反馈和不断适应来学习。这些过程不是我们可以轻松地手工编码到模型中的东西。

该论文认为，构建AGI可能需要来自认知科学的新见解，而不是仅仅在LLM训练上投入更多计算资源。

----

我的观点？LLM是通向更好工具的垫脚石，但它们不是目的地。

如果我们想要真正的AGI，我们需要一个不同的基础。

---

## 评论精选

### u/Je-ne-dirai-pas (157 赞)
这里有一个非常强烈的相反观点，

但AGI只是一个营销术语，作为一个认真对待AI的人，当我看到它时，我只是用"政治和经济中的AI"来代替AGI或ASI。

而且如果你30年前问计算机科学家"真正的智能"意味着什么，他们会列出AI在过去3年中实现的事情。

"真正的智能"只是在移动门柱，满足我们的自我，使人类保持对AI的优越性。

AI不需要有灵魂或成为人类才能是智能的。如果它在阅读理解和问答方面能够比人类更准确、更快，它已经是真正的智能了

**回复 u/Crosas-B (49 赞):** 不是30年前，读一下10年前说的话。人们一直在忽视我们在短短十年中取得了多大的进步。

即使是图灵测试也被认为要到2050年才能被超越。

**回复 u/mazdarx2001 (8 赞):** 我记得在2012-2016年研究它。那个日期出现了很多。他们错了

**回复 u/gentoofoo (4 赞):** 我记得当时人们认为围棋永远不可能被AI在我们的有生之年赢得

**回复 u/IboughtBetamax (2 赞):** 我记得他们认为计算机永远不可能在国际象棋上击败大师。那不久之前。

**回复 u/Alphamacaroon (18 赞):** 为什么我们总是将AGI等同于准确性和速度？AGI需要能够在恶劣天气中驾驶飞机。在孟买混乱的街道上驾驶汽车。为人质谈判。在扑克中读懂一个人的脸。我是AI的大力支持者，但我们离AGI还远着呢，这一点都不好笑。

真正的AGI定义实际上就在名字中。它需要足够通用，能够做任何人类能做的事情。而LLM肯定能做其中一些，但绝对远远不能做全部。

**回复 u/Lazy_Willingness_420 (11 赞):** 那是一个定义。你的立场是，要被认为是真正的人工智能，它必须在每个领域中都与每个人类大师一样出色。很少有人能够驾驶飞机、读懂扑克中的一个人的脸或为人质谈判。他们可能只能做其中一件事。所以这有待商榷。

**回复 u/Alphamacaroon (15 赞):** 正确，但大多数人，经过训练，有能力做这些事情。所以AGI至少必须有能力做所有这些事情。即使是LLM的最大支持者也会承认，语言模型将永远无法做其中许多事情，无论你训练它们多少。

所以关于这个帖子的确切主题，我近乎100%确定"LLM不会带我们走向AGI"

也就是说，我们必须先爬后走，毫无疑问，LLM将通过我们从中获得的效率加速通往AGI的道路。第一个AGI不会基于LLM（至少不是我们今天所知的），但我肯定可以看到LLM负责帮助我们发现如何构建一个。

**回复 u/Quarksperre (5 赞):** 你也可以列出像AI能够像普通16岁少年一样玩Steam上新发布的游戏。它应该能够在不被持续利用的情况下卖汉堡。它应该能够学习导航（至少模拟）任何16岁少年能够导航的地方。

有很多非常简单的任务，当前一代失败了，这基本上归结为临时学习和一些其他东西。

Hassabis以及Sudskever都认为需要另一个突破，这是有原因的。

**回复 u/Disagreeswithfems (2 赞):** 你可以轻易列出一大堆AI能做而人类"不能"做的事情。信息回忆和保留。计算。近乎瞬间的处理，同时也运行几十个有意识的查询和检查。

对于这些能力，人类连运行在数据中心的LLM的1%都匹配不了。

它们在驾驶方面比我们接近得多。

你也可以指出黑猩猩在空间回忆和意识方面能做的事情。人类和AI都无法通过最简单的黑猩猩能轻松通过的测试。

与其他许多动物也是如此。辨别植物种类。处理气味。通过庞大的迁徙模式记住位置。每个生物都进化出擅长特定的事情。

将针对人类环境的特定测试应用于LLM是愚蠢的。LLM无法像人类无法判断数字668中有多少位一样判断strawberry中有多少个R。

**回复 u/Ok-Ambassador4679 (13 赞):** 没有人类，LLM在做什么？没有LLM，人类在我们所有有意义的语境中仍然是智能的。我恭敬地不同意，你对"智能"的看法相当狭隘，但我愿意了解更多关于LLM如何与人类智能竞争的信息。

我的观点是，自从计算器出现以来，计算机总是能够比大多数人类更快、更可靠地执行它被设计来执行的流程。LLM可以在几分之一秒内扫描互联网，应用上下文视角，并生成一个需要人类花费数年阅读所有相同来源才能得出答案的回答。这不是智能，它只是一个可以被神经网络的基本知识轻松理解的过程，而且可以说这不是找到一个人类可以在前几个网站就能逻辑得出的问题的答案的最优雅方式。

### u/swootanalysis (19 赞)
你知道我得多少次阅读烤箱后面盒子上的说明，才能知道在设定温度下烤多长时间吗？

我得为包含2个变量的1个句子使用RAG。

我不是说你错了，但如果你是对的，那么我认为这不是你认为自己对的原因。

**回复 u/Lazy_Willingness_420 (7 赞):** 总体上同意这一点。我的意思是，理论上看着我的手表是作弊。我应该只是"知道"时间。

### u/Basicly-Inevitable (17 赞)
我认为观点是LLM将通过加速项目速度帮助我们制造真正的AGI。

**回复 u/Longjumping-Code2164 (7 赞):** 我的意思是，有点，我还没有看到一个可靠的用例，它既快又可靠。我知道你会说编码，但我每天都读到代码充满了错误。

**回复 u/ShelZuuz (3 赞):** 你从有议程的反AI人士那里听到这些，他们把例外情况当作常态。或者他们使用或阅读过时的模型，把它当作是最先进的技术。

就其现状而言，AI平均而言不会比资深开发者写得更差的代码。它会犯一些搞笑的愚蠢错误，一个资深开发者永远不会犯，然后它也会写出数千行无错误的代码，一个资深开发者也不会做到。

### u/throwaway3113151 (12 赞)
更广泛的问题是AGI是什么

**回复 u/Drevicar (6 赞):** 每次实现后定义都会改变。但最初的定义是任何在广泛领域上具有通用智能的人工智能。就像国际象棋大师AI在目标是赢得国际象棋时远比人类更智能，但同样的智能不能应用于其他领域。LLM并不在每个领域都展示智能，但单一模型展示至少人类水平智能的领域数量超过了单个人类展示智能的领域数量。

**回复 u/Alphamacaroon (2 赞):** 我认为我们通过将智能定义为在知识至上的领域中表现出色来限制自己。同样有众多领域，直觉、批判性思维，甚至偏执和信仰比知识更重要。

如果你见过孟买繁忙的十字路口，你会明白系统运作的唯一方式是通过直觉（判断哪些司机和你站在一起，哪些反对你）、偏执（防御性驾驶），甚至信仰（我有信心如果你突然在我前面转弯，你可能不想撞到我）的组合。没有规则，知识用处有限，因为它是一个本质上混乱的系统，无法真正学习，只能体验。

要成为真正意义上的AGI，它将需要用同一个大脑解决复杂的数学问题，同时导航混乱的、无规则的系统。我认为许多研究人员现在同意，LLM可能永远无法同时做到这两件事。

### u/Ill-Bullfrog-5360 (5 赞)
对我来说，LLM是大脑的言语皮层。我们需要构建每个部分和执行功能

### u/Even_Republic_936 (3 赞)
程序员不是神经科学家，他们除了科学废话之外没有什么可以喂给没有足够高级学位来瞬间知道胡说八道的人。说LLM可以导致真正的人工智能，就像制造某物然后声称它很快会导致任何不存在的幻想技术一样。两者之间的联系是编造的，它只存在于人们的脑海中。

当他们发明汽车时，他们本可以同样容易地说它是战斗机械人的有限形式，如果杜邦公司给我们更多钱，很快就会到来。当他们发明微波炉时，他们本可以同样容易地说它基本上是企业号发射的相位枪的原型，如果政府再给我们几百亿美元的话。它只是一个东西，不是他们用心理锚定附加到它的实际东西，可能导致实际东西，尽管我们没有真正的理由怀疑它会。

### u/AmbidextrousTorso (2 赞)
规模不能解决这些问题，但LLM是重要的一步。即使是现在，LLM也可以递归地改进自己，包括预训练步骤。理论上，在这一点上，一个微小的调整就足以引导AGI，但实际上，让人类参与循环对于创造力和一些验证是至关重要的。

但有很多方法可以解决问题。要么我们可以继续结合和改进当前类似的架构，包括LLM，像模块一样增加能力并递归地改进这些。这至少根据宽松的定义可以是AGI，并且可能能够提出更好的架构。

或者我们可以自己想出一个全新的架构，只需要引导，能够进行真正的持续学习，并且有足够的创造力，能够在每个级别上递归地改进自己的架构。

无论哪种情况，我们都在朝着那里前进。

### u/tipsystatistic (2 赞)
人们被LLM愚弄是因为它们说我们的语言。没有人认为Midjourney会变成AGI，因为它不能进行对话。但根据不同的指标，它可能比LLM更"智能"。

### u/SnooSongs5410 (2 赞)
随机鹦鹉不聪明，12点新闻。