从银牌到金牌只差一年,谷歌DeepMind却把风头送给了OpenAI
AI模型斩获国际数学竞赛金牌
近日,人工智能领域的两大领军者------OpenAI与谷歌DeepMind相继宣布,其AI模型在2025年国际数学奥林匹克竞赛(IMO)中荣获金牌。这一成就不仅展示了人工智能推理能力的飞速提升,也意外掀起了两家公司在"技术领先"地位上的激烈较量。
IMO是全球历史最悠久、最具挑战性的高中数学赛事之一,其成绩被视为衡量AI推理能力的重要指标。去年,谷歌凭借一个需人工辅助的"正式"系统获得了银牌。而今年,OpenAI与谷歌均推出了更为先进的非正式系统,这些系统能够直接理解自然语言问题,生成逻辑清晰、结构完整的解答,无需人工干预。双方均宣称,其AI模型在六道题目中成功解答了五道,超越了大多数高中生以及谷歌去年的表现。
推理模型的突破与争议
在接受采访时,OpenAI与谷歌IMO项目的研究人员指出,此次金牌成绩标志着AI推理模型在不可验证领域实现了重大突破。这类模型以往在答案明确的问题上表现优异(如基础数学或编程),但在解决模糊复杂任务时则力不从心。
然而,关于"谁先宣布"和"如何宣布"金牌成绩的争议,引发了一场激烈争论。OpenAI于周六清晨率先发布消息,宣称其AI模型获得金牌,此举迅速遭到谷歌DeepMind高管与研究人员的质疑。
谷歌DeepMind高级研究员、IMO项目负责人Thang Luong在接受TechCrunch采访时表示,谷歌选择在官方结果公布后再对外披露,是为了尊重参赛学生,并强调其与IMO组织方合作完成了测试。谷歌于周一上午正式公布成绩,该结果得到了IMO主席与官方评分团队的认可。Luong指出:"国际数学奥林匹克组织者有自己的评分标准。因此,任何未依据该标准得出的评估,都无法声称达到金牌水平。"
各执一词,竞争白热化
OpenAI参与IMO模型开发的Noam Brown回应称,数月前IMO曾邀请OpenAI参与正式比赛,但因团队专注于开发更具研究价值的自然语言系统而婉拒。Brown表示,OpenAI并不知情IMO正与谷歌进行非正式测试。
OpenAI方面表示,他们聘请了三位曾获IMO奖牌的专家作为第三方评估人员,评估其AI模型的表现。在得知金牌成绩后,OpenAI联系了IMO,但IMO建议其在周五晚颁奖典礼结束后再公布结果。截至目前,IMO尚未回应TechCrunch的置评请求。
尽管谷歌在程序上更为严谨,但这场争议背后,反映出全球顶尖AI实验室的技术正以前所未有的速度发展。今年全球最优秀的高中生齐聚IMO,但只有极少数人的得分能与OpenAI与谷歌的AI模型相媲美。
这表明,曾在AI领域遥遥领先的OpenAI,如今正面临前所未有的激烈竞争。随着OpenAI预计在未来几个月推出GPT-5,能否维持其"技术领先"的形象,已成为这场"氛围之战"的核心焦点。