近日,第二届人工智能数学奥林匹克竞赛(AIMO2)成绩揭晓,由香港中文大学(深圳)王本友教授团队、华为技术团队联合是石科技组成的联合战队凭借卓越的技术方案与算力支持,在2000余支全球顶尖团队中脱颖而出,以50道B榜题目答对28道的优异成绩并列第8,位列前0.4%,荣获竞赛金牌。
顶级赛事挑战AI数学推理极限
AIMO竞赛由全球顶尖量化交易公司XTX Markets发起,是国际数学奥林匹克(IMO)的AI版本,旨在推动AI模型达到人类顶级数学选手水平。本届赛事设置110道国家级奥赛难度原创题目(涵盖代数、组合、几何与数论),要求AI必须通过深度推理而非简单计算得出答案。参赛团队需严格遵守两项核心规则:一是仅能使用开源大模型,二是在固定算力限制内完成解题。这些条件旨在公平评估模型本身的数学能力,而非依赖算力或数据优势。
赛事吸引了2000余支全球顶尖团队竞逐,其影响力不仅体现在创纪录的奖金规模上,更在于它构建了一个透明、防数据泄露的评估体系,为AI数学推理能力树立了黄金标准。赛事直接瞄准人类顶级数学思维能力的机械化重构,若成功突破,将推动AI在科学研究、工程优化、金融建模等领域的颠覆性应用,甚至可能催生出具备自主数学发现能力的下一代AI系统。被业界视为衡量通用人工智能(AGI)演进的关键风向标之一。
联合团队创新方案:高效投票算法与算力优化赋能
是石科技作为联合团队的算力支持方,依托自研“磐石”超智算融合算力平台与“玄机”调度系统,为模型训练与推理提供高效稳定的算力保障和优化赋能。联合团队在高质量和高难度的微调和高效强化学习方案基础上,创新性地提出高效投票算法short vote——通过并行解码过程中提前终止低效生成路径,在短答案阶段进行投票,显著减少“过度思考”(overthinking)现象,提升GPU利用率与推理效率。这一技术路径充分体现了团队在异构算力优化与算法协同设计上的核心优势。
王本友教授团队:数学推理与建模的深厚积淀
王本友教授团队长期深耕AI数学推理领域,其多项研究成果已成为行业标杆:
OVM算法:首个在GSM-8K数据集上使13B以下模型准确率突破70%的技术,被全球前20名开源模型广泛采用;
MathScale:联合微软亚洲研究院提出的可扩展数据生成方法,相关论文被ICML 2024收录,其MathScale-7B模型在十项基准测试中准确率领先同等规模模型超40%;
Math-Omni:与阿里Qwen团队联合发布的奥林匹克级数学评估基准(ICLR 2025收录),揭示当前最优开源模型在奥数题上仅达36.2%准确率;
MAMO:是首个面向数学建模能力评估的大型语言模型基准,不仅填补了数学建模评估空白,也为推进语言模型通往具备抽象能力的通用智能奠定了基础。
ORLM数学建模大模型:联合杉数科技开发的业界首个数学建模专用模型,已落地应用于生产系统。
团队还将数学推理能力拓展至医疗领域,其与深圳市大数据研究院联合发布,是石科技副总经理、香港中文大学博士侯建业带领团队提供技术、研发支撑的HuatuoGPT-o1成为首个实现“可验证医学复杂推理”的大模型,在多项医疗基准中超越专业模型,获GitHub千星关注。
是石科技:超智融合加速AI产业化
作为国内领先的超算与AI服务企业,是石科技以“超智融合,加速AI产业化”为使命,公司以算力网络为基础,以“超智融合,加速AI产业化”为使命,打造标准化、高效能HAI统一计算平台与模型专家服务平台,助力国家科研创新,赋能千行百业智能化升级。公司核心业务涵盖算力中心建设、异构算力调度优化及行业级AI模型服务,为构建智能世界提供基石支撑。
目前,公司平台已经成功应用于人工智能、气候气象、工业仿真、生物信息、航空航天等20多个领域。
盖世汽车2025-04-28 10:4204-28 10:42