OpenAI 发布的新一代模型 o3 在 FrontierMath 数学基准测试中取得显著成绩,但随后被曝出提前获取测试题的争议。一位 Epoch AI 承包商在 LessWrong 论坛上爆料称,OpenAI 不仅资助了测试,还获得了特权访问权。此事引发 AI 圈轩然大波,网友质疑 OpenAI 既当裁判又当选手。
Epoch AI 联合创始人承认未更早披露 OpenAI 的参与情况,并表示合同禁止他们这么做。面对质疑,他们承诺未来将采用更高的透明度标准。然而,斯坦福大学数学博士生 Carina Hong 声称 OpenAI 拥有特权访问权,且多位数学家表示若事先知情可能不会参与。尽管 Epoch AI 和 OpenAI 进行了澄清和道歉,但争议并未平息,更多批评声音涌现。同时,OpenAI 的“Operator”项目取得突破,但在此节骨眼上,o3 的争议或许需要更直接的回应来平息。