Import AI:AI系统即将开始自我构建——递归自我改进的第一步
#AI热点与创业 时间2026-05-05 11:51:50

2026年5月4日,Import AI第455期 newsletter发表长文指出,AI系统正快速接近能够自主进行端到端AI研发(AI R&D)的阶段,甚至可能在2028年底前实现“无人类参与的AI研发”——即AI系统强大到足以自主构建其继任者。这标志着递归自我改进(recursive self-improvement)的第一步,将把人类带入一个几乎无法预测的未来。
核心预测:60%+概率在2028年前实现
作者Jack Clark(前OpenAI政策主管)基于公开信息(arXiv、bioRxiv、NBER论文及前沿公司产品)得出结论:所有自动化当前AI系统工程组件的要素已就位。若scaling趋势持续,模型将具备足够创造力,不仅能优化现有知识,还能提出新颖研究路径,推动前沿进步。
他预计2026年不会发生,但“模型端到端训练其继任者”的概念验证可能在1-2年内出现(非前沿模型阶段更容易,前沿模型因成本和人力投入更高而更难)。
证据一:编码能力的“奇点”
AI已彻底改变代码生产。SWE-Bench(评估AI解决真实GitHub问题的基准)从2023年底Claude 2的约2%成功率,飙升至Claude Mythos Preview的93.9%,接近饱和。现实中,前沿实验室工程师已全面通过AI编写代码、测试代码。
METR的时间跨度图显示AI独立完成任务的能力指数级增长:
· 2022年(GPT-3.5):约30秒
· 2023年(GPT-4):约4分钟
· 2024年(o1):约40分钟
· 2025年(GPT-5.2):约6小时
· 2026年(Opus 4.6):约12小时
Ajeya Cotra预测,到2026年底,AI或能可靠完成需人类100小时的任务。这直接对应agentic coding工具的爆发,也让AI能接管AI研发中大量“几小时级”任务(如数据清洗、实验启动)。
证据二:核心科学技能的自动化
AI在复制研究结果、链式组合机器学习技术、优化AI系统本身等AI研发核心技能上进展显著。CORE-Bench(计算可复现性代理基准)要求AI安装依赖、运行代码并回答问题,自2024年9月推出后已取得显著进步。
这些能力结合,使AI不仅能辅助人类科学家,还能部分自动化R&D流程——从指定实验方向、运行实验到验证结果。
意义与风险:跨越“卢比孔河”
一旦实现端到端自动化AI研发,人类将跨过“卢比孔河”,进入几乎无法预测的未来。AI不仅加速现有研究,还可能自主探索新路径,实现真正的递归自我改进。
Clark强调,这并非遥远科幻,而是基于当前公开趋势的“勉强结论”。他计划2026年深入探讨其影响,并呼吁社会为自动化AI研发带来的剧变做好准备。
当然,基准存在噪声,真实世界部署仍面临成本、可靠性与对齐挑战。但趋势清晰:AI正从“工具”走向“研究者”,而人类需思考如何与之共存并引导其发展。
评论
0 条登录后才可以发表评论。
立即登录