简体中文
关闭
AI新闻中心

Import AI:AI系统即将开始自我构建——递归自我改进的第一步

#AI热点与创业 时间2026-05-05 11:51:50


202654日,Import AI455newsletter发表长文指出,AI系统正快速接近能够自主进行端到端AI研发(AI R&D)的阶段,甚至可能在2028年底前实现无人类参与的AI研发”——AI系统强大到足以自主构建其继任者。这标志着递归自我改进(recursive self-improvement)的第一步,将把人类带入一个几乎无法预测的未来。

核心预测:60%+概率在2028年前实现

作者Jack Clark(前OpenAI政策主管)基于公开信息(arXivbioRxivNBER论文及前沿公司产品)得出结论:所有自动化当前AI系统工程组件的要素已就位。若scaling趋势持续,模型将具备足够创造力,不仅能优化现有知识,还能提出新颖研究路径,推动前沿进步。

他预计2026年不会发生,但模型端到端训练其继任者的概念验证可能在1-2年内出现(非前沿模型阶段更容易,前沿模型因成本和人力投入更高而更难)。

证据一:编码能力的奇点

AI已彻底改变代码生产。SWE-Bench(评估AI解决真实GitHub问题的基准)从2023年底Claude 2的约2%成功率,飙升至Claude Mythos Preview93.9%,接近饱和。现实中,前沿实验室工程师已全面通过AI编写代码、测试代码。

METR的时间跨度图显示AI独立完成任务的能力指数级增长:

· 2022年(GPT-3.5):约30

· 2023年(GPT-4):约4分钟

· 2024年(o1):约40分钟

· 2025年(GPT-5.2):约6小时

· 2026年(Opus 4.6):约12小时

Ajeya Cotra预测,到2026年底,AI或能可靠完成需人类100小时的任务。这直接对应agentic coding工具的爆发,也让AI能接管AI研发中大量几小时级任务(如数据清洗、实验启动)。

证据二:核心科学技能的自动化

AI在复制研究结果、链式组合机器学习技术、优化AI系统本身等AI研发核心技能上进展显著。CORE-Bench(计算可复现性代理基准)要求AI安装依赖、运行代码并回答问题,自20249月推出后已取得显著进步。

这些能力结合,使AI不仅能辅助人类科学家,还能部分自动化R&D流程——从指定实验方向、运行实验到验证结果。

意义与风险:跨越卢比孔河

一旦实现端到端自动化AI研发,人类将跨过卢比孔河,进入几乎无法预测的未来。AI不仅加速现有研究,还可能自主探索新路径,实现真正的递归自我改进。

Clark强调,这并非遥远科幻,而是基于当前公开趋势的勉强结论。他计划2026年深入探讨其影响,并呼吁社会为自动化AI研发带来的剧变做好准备。

当然,基准存在噪声,真实世界部署仍面临成本、可靠性与对齐挑战。但趋势清晰:AI正从工具走向研究者,而人类需思考如何与之共存并引导其发展。

相关标签:

分享本文
Import AI:AI系统即将开始自我构建——递归自我改进的第一步

Import AI:AI系统即将开始自我构建——递归自我改进的第一步

2026年5月4日,Import AI第455期 newsletter发表长文指出,AI系统正快速接近能够自主进行端到端AI研发(AI R&D)的阶段,甚至可能在2028年底前实现“无人类参与的AI研...

评论

0 条
暂无评论,快来抢沙发。

Copyright © 2026 IAICA 版权所有  隐私政策 用户协议 Cookie说明 备案号:沪ICP备11018632号-8

18351659883