惨痛教训回响2025!LLM陷数据陷阱,AGI该往哪走?

文┃小夏编辑┃叙言2025年9月27日,强化学习之父理查德・萨顿的一场访谈直接引爆AI圈。这位DeepMind的灵魂人物对着当下大火的LLM泼了盆冷水,直言这些模型只是人类行为...

惨痛教训回响2025!LLM陷数据陷阱	,AGI该往哪走?

文┃小夏

编辑┃叙言

2025年9月27日 ,强化学习之父理查德・萨顿的一场访谈直接引爆AI圈。

这位DeepMind的灵魂人物对着当下大火的LLM泼了盆冷水,直言这些模型只是人类行为的模仿者,根本算不上真正理解世界 。

惨痛教训回响2025!LLM陷数据陷阱	,AGI该往哪走?

萨顿VS卡帕西,AI路径大分歧

现在AI圈基本被LLM的热度裹挟着往前走,大家都在琢磨怎么让模型更好用、落地更快 ,这背后是安德烈・卡帕西代表的实证派思路 。

但萨顿偏不按常理出牌,他更关心一个根本问题,什么是真正的智能?

惨痛教训回响2025!LLM陷数据陷阱	,AGI该往哪走?

这两位大佬的分歧其实挺有意思,卡帕西盯着眼前的工程化落地,萨顿却在仰望AGI的星辰大海。

这种分歧不是第一次出现 ,AI发展史上一直有工程派和理论派的博弈。

惨痛教训回响2025!LLM陷数据陷阱,AGI该往哪走?

但2025年这次不一样,萨顿的批判直指LLM的底层逻辑 ,让很多人开始反思 ,我们是不是在错误的道路上越走越远?

LLM的困局,只会模仿不会理解

萨顿的核心观点很犀利,LLM本质上是在对人类行为做概率拟合 。

惨痛教训回响2025!LLM陷数据陷阱	,AGI该往哪走?

它们的训练目标就是预测下一个词,听起来高级,其实只是内部的一致性检查 ,跟现实世界没半毛钱关系。

举个例子,现在有些LLM能写科研论文,但经常冒出虚假数据。

惨痛教训回响2025!LLM陷数据陷阱	,AGI该往哪走?

为啥?因为它们不知道什么是"正确",只知道哪个答案在语料里出现的概率最高,约翰・麦卡锡早就说过 ,智能必须包含实现目标的能力 。

很显然,LLM连基本的目标验证都做不到,更别说自我纠错了。

惨痛教训回响2025!LLM陷数据陷阱	,AGI该往哪走?

本来想夸LLM能跟人聊天多厉害 ,后来发现它们只是构建了一个"人类行为模型",它们能预测对话走向,却不知道随手扔个杯子会摔碎。

如此看来 ,LLM只是被动的观察者,根本成不了主动的行动者,这大概就是LLM最大的认知鸿沟吧 。

强化学习 ,AGI的闭环密码

惨痛教训回响2025!LLM陷数据陷阱,AGI该往哪走?

萨顿之所以敢炮轰LLM,是因为他手里握着强化学习这张王牌 ,在他看来,强化学习不是简单的算法,而是智能的本身。

它的核心逻辑很简单 ,感知-行动-奖励的闭环。

惨痛教训回响2025!LLM陷数据陷阱,AGI该往哪走?

就拿2025年工业机器人的突破来说,那些能自主完成复杂装配任务的机器人 ,靠的就是强化学习 。

它们在反复试错中学会预测行为后果 ,再根据环境反馈调整策略。

这里面的价值函数很关键,能把长期目标转化为当下的决策依据,就算没有即时奖励也能坚持方向。

惨痛教训回响2025!LLM陷数据陷阱	,AGI该往哪走?

萨顿还提到了AlphaZero,这个靠自我博弈成长的系统才是真・智能典范 。

它不依赖人类数据,自己跟自己下棋就能超越人类专家 。

反观LLM ,上限早就被人类互联网语料锁死了。

惨痛教训回响2025!LLM陷数据陷阱,AGI该往哪走?

如此看来,过度依赖人类数据 ,可能是LLM最致命的陷阱。

松鼠测试与AGI的未来

萨顿提出的"松鼠测试"彻底颠覆了很多人的认知 。

惨痛教训回响2025!LLM陷数据陷阱,AGI该往哪走?

他说,如果我们能搞懂松鼠怎么在树上跳跃 、找食物 ,就解决了95%的智能问题。

语言?不过是表层的饰面而已,这个观点初听很离谱,细想却很有道理。

你看自然界的动物 ,没有谁是靠被喂标注好的数据集学习的 。

惨痛教训回响2025!LLM陷数据陷阱,AGI该往哪走?

乌鸦用工具 、松鼠储食物,都是试错和主动探索的结果。

这大概就是生物学习的本质,也是LLM最欠缺的能力 ,谈到未来,萨顿的视角更宏大。

他说AI的出现是宇宙级的相变,从复制者时代进入设计者时代 。

惨痛教训回响2025!LLM陷数据陷阱	,AGI该往哪走?

但数字智能也有专属风险,比如"精神腐败",多个分身学习后融合 ,容易引入错误信息导致思维瓦解。

萨顿的观点不一定全对,但他给我们提了个醒,AI发展不能只追求短期热度。

LLM的繁荣是阶段性成果 ,但绝非AGI的终极路径 。

惨痛教训回响2025!LLM陷数据陷阱,AGI该往哪走?

强化学习的闭环逻辑、主动探索的学习方式,或许才是突破认知鸿沟的关键。

当AI真正学会理解世界而非模仿人类 ,当它们能像松鼠一样主动适应环境 ,人类与智能的关系可能会迎来全新重构。

而这一天的到来,怕是离不开强化学习的持续突破 。

声明:本文内容均是根据权威材料,结合个人观点撰写的原创内容 ,辛苦各位看官支持,请知悉 。

惨痛教训回响2025!LLM陷数据陷阱,AGI该往哪走?

本文来自作者[芷云]投稿,不代表视听号立场,如若转载,请注明出处:https://m.stddy.com/keji/202512-67417.html

(3)

文章推荐

发表回复

本站作者后才能评论

评论列表(4条)

  • 芷云
    芷云 2025年12月23日

    我是视听号的签约作者“芷云”!

  • 芷云
    芷云 2025年12月23日

    希望本篇文章《惨痛教训回响2025!LLM陷数据陷阱,AGI该往哪走?》能对你有所帮助!

  • 芷云
    芷云 2025年12月23日

    本站[视听号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 芷云
    芷云 2025年12月23日

    本文概览:文┃小夏编辑┃叙言2025年9月27日,强化学习之父理查德・萨顿的一场访谈直接引爆AI圈。这位DeepMind的灵魂人物对着当下大火的LLM泼了盆冷水,直言这些模型只是人类行为...

    联系我们

    邮件:视听号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们