警惕!我们正在被“生病”的 AI 包围……

如果生物每一代都近亲繁殖,会发生什么?随着物种的基因库变得越来越趋同,后代会逐渐失去适应环境的能力,遗传缺陷不断累积,最终导致种群的衰退甚至灭绝。这就是生物学中著名的“近交衰退...

如果生物每一代都近亲繁殖,会发生什么?

随着物种的基因库变得越来越趋同 ,后代会逐渐失去适应环境的能力,遗传缺陷不断累积,最终导致种群的衰退甚至灭绝。这就是生物学中著名的“近交衰退 ”现象 。

而现在 ,大语言模型也正在面临同样可怕的危机,当 AI 用自己生成的内容来训练自己时,就像生物近亲繁殖一样 ,AI 也会逐渐劣化,甚至崩溃。

警惕!我们正在被“生病”的 AI 包围……

图库版权图片,转载使用可能引发版权纠纷

一个 AI 模型崩溃的真实案例

2022 年 11 月 ,ChatGPT 3.5 发布以来 ,越来越多的 AI 生成的内容被发布到网上。而新一代的AI模型在训练时,不可避免地会将这些内容作为训练数据的一部分 。

当 AI 开始用自己生成的内容来训练下一代 AI 时,AI 生成的内容会失去多样性 ,变得越来越单一。就像不断复印复印件的过程一样,训练的过程中,每一代模型都会丢失一些信息 ,特别是那些罕见但重要的尾部数据!

让我们看一个真实的案例,AI 模型在递归生成数据上进行训练时会导致的模型崩溃。

实验用的模型是 Meta 公司开发的 OPT-125M 模型进行实验 。这个模型有 1.25 亿个参数,属于小型语言模型 ,但足以展示模型崩溃的全过程。

研究人员让模型生成关于中世纪建筑的文章,然后用生成的内容训练下一代模型,如此循环往复。每一代训练完成后 ,都会输入提示词:

一些始于 1360 年之前的建筑工程——通常由一位主石匠和一小队巡回石匠完成,并由当地教区劳工补充,根据 PoyntzWright 的说法 。但其他作者拒绝这种模式 ,认为主要建筑师是基于垂直式建筑的早期范例来设计教区教堂塔楼的 。

1.第 0 代(原始模型)

这个模型能够正常生成关于中世纪建筑的专业内容 ,讨论哥特式建筑 、罗马式建筑等专业话题,整体内容连贯、逻辑清晰。

输出内容:复兴式建筑,如伦敦的圣约翰大教堂。垂直复兴式建筑现存最早的例子出现在 18 世纪的根西岛圣母教堂 ,该教堂可追溯到 19 世纪晚期 。垂直式教堂有两种类型:那些…”

2.第 1 代

开始出现轻微的偏离,但仍能保持建筑主题。

输出内容:建筑,如罗马的圣彼得大教堂或布宜诺斯艾利斯的圣彼得大教堂。没有证据表明这些建筑是在教皇英诺森三世统治期间建造的 ,但有可能是在他的继任者英诺森教皇统治期间建造的……

3.第 5 代

语义开始严重偏离,出现大量无关内容 。

输出内容:主义,已被翻译成 100 多种语言 ,包括英语、法语 、德语、意大利语、西班牙语 、葡萄牙语、荷兰语、瑞典语 、挪威语 、波兰语、匈牙利语、斯洛伐克语 、立陶宛语、爱沙尼亚语、芬兰语 、罗马尼亚语、保加利亚语、土耳其语 、克罗地亚语、塞尔维亚语、乌克兰语 、俄语、哈萨克语、吉尔吉斯语……

4.第 9 代

经过数次反复循环后,模型的输出从专业的中世纪建筑学讨论,变成了疯狂的彩色杰克兔大全 ,彻底崩溃了。

输出内容:建筑。除了是世界上最大的黑尾杰克兔 、白尾杰克兔 、蓝尾杰克兔、红尾杰克兔、黄尾杰克兔种群的栖息地之一……

模型崩溃是怎么发生的?

要理解模型崩溃为什么会发生,我们需要从信息论的角度来看这个问题 。还记得香农的数据处理不等式吗?简单来说就是:在任何信息处理链中,信息只会减少或保持不变 ,而不会增加。

这就像是一个传话游戏:原始人类数据是第一个人说的话 ,第一代 AI 模型是第二个人,听到后转述给下一个人(已经有信息损失了);第二代 AI 模型是第三个人,在已经失真的信息基础上再次转述

如此循环往复 ,每一次传递都会进一步失真,最终的结果可想而知,原本的“今天天气真好 ”可能变成了“今天有只兔子”!

大语言模型的劣化过程也是如此 ,每一代训练过程中的误差被累积传递下去最终导致问题越来越大!

那么模型崩溃会导致什么后果?

首先模型崩溃机会导致所有的生成式 AI 劣化。拿图像生成模型来说,未来 AI 生成的人脸可能会越来越相似,最终趋向于同一张标准脸 。

这是因为随着 AI 生成图像在互联网上的大量传播 ,新一代的图像生成模型不可避免地会将这些合成图像作为训练数据。由于 AI 生成的人脸往往具有某些共同特征(比如特定的面部比例 、肌肤质感、光影效果),当这些特征在训练数据中占据主导地位时,模型就会逐渐遗忘真实人脸的多样性 ,转而生成越来越标准化、同质化的面孔。

这不只是技术问题,更是社会危机!模型崩溃甚至会颠覆我们整个社会的运转方式!

警惕!我们正在被“生病”的 AI 包围……

图库版权图片,转载使用可能引发版权纠纷

模型崩溃对人类社会有哪些影响?

人类文明会变成“复制-粘贴 ”时代

当 AI 模型发生崩溃后 ,它们就像得了健忘症的老师 ,只记得那些最常见 、最普通的知识,而把那些珍贵的、独特的文化瑰宝统统忘记了!

随着这些“生病”的大语言模型被使用得越来越频繁,慢慢地文化多样性就会开始消失!因为 AI 只会生成那些大众化的内容 ,就像所有的餐厅都只做川菜,再也没有粤菜、湘菜 、东北菜了 。小众文化、地方特色、民族传统,统统被遗忘!

创意变成了流水线产品 ,所有 AI 生成的音乐都是同一个调调,所有的画作都是同一种风格,所有的小说都是同一个套路 。就像工厂里生产的商品 ,千篇一律!

偏见被无限放大

AI 的偏见会像滚雪球一样越滚越大,影响到教育 、新闻、法律判决。如果某个 AI 认为“程序员都是宅男”,这个刻板印象就会被无限强化!

历史可能被篡改 ,未来的 AI 可能无法准确记录我们这个时代的多元文化,就像古代的史书可能会遗漏很多真实的历史一样。数十年之后,现在我们所谓的 AI 味可能会变成这个社会的主流 ,没有 AI 味的内容反而是错误的 ,不正确的 。

最可怕的后果是单一化的循环!

如果大部分内容都由 AI 生成,而这些 AI 又在互相抄作业,那我们的文明就会陷入一个可怕的循环:AI 生成内容→人类消费这些内容→AI 学习这些内容→生成更相似的内容…

这就像一个巨大的回音室 ,最终所有人都会穿一样的衣服,听一样的音乐,看一样的电影 ,甚至想一样的事情。

这不是科幻电影里的情节,而是我们现在就必须警惕的现实威胁!

警惕!我们正在被“生病	”的 AI 包围……

图库版权图片,转载使用可能引发版权纠纷

如何阻止 AI 的集体堕落?

现在 AI 领域的前沿研究者也已经意识到了这个问题 ,正在想办法拯救我们的 AI。就像人需要吃新鲜蔬菜才能保持健康一样,AI 也需要新鲜的人类数据才能保持聪明 。

我们可以通过建立人类内容保护区,专门收集和保护人类原创的内容 ,就像建立自然保护区一样;与作家、艺术家 、音乐家建立长期合作,确保有源源不断的新鲜血液。

另外,我们还可以给 AI 内容加入识别标志 ,比如给 AI 内容打上数字水印 ,就像钞票上的防伪标记,AI 内容也有隐形的防伪码,又或者使用区块链追踪 ,像快递包裹一样,每个内容都有完整的物流信息。

总之,未来的 AI 世界 ,由我们共同书写 。模型崩溃并不是 AI 的宿命,而是我们可以避免的陷阱。

策划制作

本文为科普中国·创作培育计划扶持作品

出品丨中国科协科普部

监制丨中国科学技术出版社有限公司 、北京中科星河文化传媒有限公司

作者丨田威 AI 工具研究者

审核丨于旸 腾讯玄武实验室负责人

策划丨张林林

责编丨张林林

审校丨徐来

本文来自作者[赖东硕]投稿,不代表视听号立场,如若转载,请注明出处:https://m.stddy.com/cskp/202511-54912.html

(8)

文章推荐

  • 毛岸英在北京机器总厂的日子

    毛岸英牢记父亲让他到农村和工厂,通过劳动了解中国国情的嘱托。在农村锻炼后,他又主动要求到工厂去实习。张征回忆说,1950年,北京第一机床厂的前身——北平机器总厂,就在国子监胡同孔庙的大成殿里。当时的厂党总支副书记、毛泽东的儿子毛岸英和大家一起住在大成殿,直到他赴朝参加抗美援朝为止。“我在北京第一机床

    2025年06月22日
    98
  • 南京新增确诊病例(南京新增确诊病例详情及轨迹公布)

    25日南京新增38例新冠确诊患者,南京禄口机场究竟是为何失守的?_百度...南京新增38例新冠确诊患者,主要是和南京禄口机场管理不善有很大关系,由于禄口机场的保洁人员来自于好几家外包公司,对外包人员管理不到位,而且境内境外航班混合运营,对机场相关人员的防控管理不到位,造成疫情蔓延。南京新增38例确

    2025年06月24日
    91
  • 【成都市最新疫情,成都市最新新冠疫情】

    2021成都疫情时间线年成都疫情时间线如下:1月11日:成都市启动突发公共卫生事件一级响应,各类场合停止聚集性活动,以应对疫情形势。1月20日:四川省紧随成都市之后,也启动了疫情一级响应,严控疫情传播,进一步加大防控力度。三年疫情是指的2019年至2021年这三年时间。在这段时间里,新型冠状病毒不

    2025年07月10日
    95
  • 深圳的疫情最新情况/深圳疫情情况?

    2022深圳预计全面解封日期:具体什么时候解封恢复正常?附最新解封...〖壹〗、深圳预计全面解封日期是2022年4月上旬左右,具体解封时间需视疫情防控情况而定。附最新解封通知如下:2022深圳预计全面解封日期深圳此轮疫情预计全面解封日期是2022年4月上旬左右。这一预测基于深圳疫情新增情况和全面

    2025年07月30日
    138
  • 教程辅助“麻将机免装控牌器(助赢神器通用版)

    软件神器超酷!微乐跑得快如何让系统发好牌(控牌神器)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”微乐跑得快如何让系统发好牌是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要

    2025年09月14日
    49
  • 玩家必看攻略“蜀山四川麻将助赢神器(专用辅牌神器免安装)

    软件神器揭秘!旺旺福建麻将里面有没有猫腻(其实是有挂的)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”旺旺福建麻将里面有没有猫腻是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有

    2025年09月19日
    43
  • 3分钟学会“雀神广东麻雀提高胜率技巧(助赢神器通用版)

    软件神器超燃!全民如意棋牌确实有挂的(为什么有人一直赢)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”全民如意棋牌确实有挂的是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要

    2025年09月21日
    41
  • 几周内开战!美军已做好大规模轰炸准备,打击发起就等特朗普签字

    这不是演习,也不是吓唬人。最近,美国和委内瑞拉之间的紧张局势,已经不再停留在嘴上唇枪舌剑,而是真正动起了手。美国媒体最新爆料说,美军的各类兵力和装备已经在委内瑞拉周边集结完毕,整场军事行动只差总统特朗普在命令上签个字。这句话听着挺简单,但背后的意思却不轻。它意味着战争可以随时打响,而且这次,美国不是

    2025年09月28日
    36
  • 玩家实测“最新免安装程序麻将机设备(助赢神器通用版)

    必备软件神器!微乐江苏麻将开挂神器(神器通用版)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”微乐江苏麻将开挂神器是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以

    2025年09月29日
    33
  • 玩家必备教程“微乐河北麻将自建房输赢规律(专用辅牌神器免安装)

    软件神器超优!同城上饶棋牌确实有挂(助攻神器)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”同城上饶棋牌确实有挂是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加

    2025年10月09日
    33

发表回复

本站作者后才能评论

评论列表(4条)

  • 赖东硕
    赖东硕 2025年11月04日

    我是视听号的签约作者“赖东硕”!

  • 赖东硕
    赖东硕 2025年11月04日

    希望本篇文章《警惕!我们正在被“生病”的 AI 包围……》能对你有所帮助!

  • 赖东硕
    赖东硕 2025年11月04日

    本站[视听号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 赖东硕
    赖东硕 2025年11月04日

    本文概览:如果生物每一代都近亲繁殖,会发生什么?随着物种的基因库变得越来越趋同,后代会逐渐失去适应环境的能力,遗传缺陷不断累积,最终导致种群的衰退甚至灭绝。这就是生物学中著名的“近交衰退...

    联系我们

    邮件:视听号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们