OpenAI于2月7日宣布,面向免费及付费用户升级o3-mini模型的思维链,其中付费用户可获得更透明、详尽的o3-mini-high版本,展示AI推理步骤及答案得出方式。去年12月发布的o3系列模型,包括高性能的o3和精简版o3-mini,后者在保持智能的同时优化了性能和成本。
o3模型在多个领域表现卓越,如在SWE-bench测试中准确率达71.7%,Codeforces竞赛评分高达2727分,AIME数学竞赛模拟准确率96.7%,并在ARC-AGI测试中首次超越人类水平,达到87.5%,标志着OpenAI在实现人工通用智能方面取得重要进展。