OpenAI最强推理模型o3发布：AGI能力暴涨接近人类水平

游戏新闻 2024-12-21 18:08:29

今日（12月21日），OpenAI“连续12日圣诞发布”终于迎来激动人心的大结局，OpenAI推出重磅收官新品，其迄今最强前沿推理模型的升级版——o3。

OpenAI号称o3在一些条件下接近通用人工智能（AGI），共有o3和精简版o3-mini两个版本。

评估显示，o3在软件工程测试中准确率比o1高近47%，竞赛数学测评的准确率比o1高15%，人类博士专家级生化物测试中准确率比o1高近13%。

AGI相关测试中，o3最佳成绩87.5，超过人类水平门槛85，显示迈向类人智能取得突破。

对比之下，GPT-3的评测结果为0%，GPT-4o为5%，而o3一举将成绩提升到87.5%。

OpenAI计划明年初发布o3系列模型，CEO Altman暗示可能一段时间内都不会面向大众上线这类模型，称希望正式发布前，先有一个联邦政府的测试框架，指导监控并减少这类模型的风险。

从本周五开始，OpenAI允许安全研究人员可以注册访问o3和o3-mini的预览。

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

如涉及作品内容、版权和其它问题，请在30日内与本网联系，我们将在第一时间删除内容,本网站对此声明具有最终解释权。