首页资讯娱乐体育游戏旅游生活母婴视频财经健康消费汽车科技

首页 > 资讯 > 正文

Qzone

微博

微信

中国电信研究院发布天罡大模型评测榜单，豆包大模型排名国产第一

资讯 TOM 2024-08-27 13:18

近日，中国电信研究院携手上海人工智能实验室、清华大学等产学研机构，发布了天罡通用大模型评测榜单。该榜单重点围绕大模型的能力和安全指标进行评估，GPT-4o综合成绩排名第一；豆包pro、通义千问Qwen-Max和智谱GLM-4在国产大模型中名列前三。

中国电信研究院发布天罡大模型评测榜单，豆包大模型排名国产第一

图：“天罡”通用大模型评测榜单

本次测评通过全面评测维度、权威评测题库、动态抽题、多裁判模型判别和人工审核等机制对国内外主流通用大模型开展了评测，评测对象包括国际头部闭源OpenAI的GPT-4系列、Google的Gemini系列、Anthropic的Claude系列、国内主流的闭源模型以及国内外主流的开源模型，评测结果展示了当前开源/闭源通用大模型整体能力分布和差距。

评测结果显示，GPT-4o在语言理解、认知推理、智能体等方面能力表现出色，总得分82.55分。国内头部大模型豆包、智谱清言在中文场景已达到GPT-4o的90%分位水平。其中，豆包pro模型得分达到79.38分，不仅在国产模型中排名最高，同时也超过了Gemini 1.5 pro、Claude3-Opus、Mistral Large等海外模型。

豆包大模型由字节跳动自研，是国内首批通过算法备案的大模型之一，正在通过字节跳动旗下云服务平台火山引擎面向企业提供服务。在近日召开的火山引擎AI创新巡展上海站活动中，新版豆包语言模型正式亮相，宣布其综合能力相比今年5月首次发布时提升了20.3%。

责任编辑： WY-BD

责任编辑： WY-BD

———— 分享到 ————

相关推荐

希沃学习机全系列接入Deepseek大模型

02-10 11:19

希沃学习机全系列接入Deepseek大模型

正式接入DeepSeek大模型，星图云服务再升级！

正式接入DeepSeek大模型，星图云服务再升级！

正式接入DeepSeek大模型，星图云服务再升级！

正式接入DeepSeek大模型，星图云服务再升级！

TOM

02-11 09:56

明汯投资：预测模型的发展是从简单到复杂的迭代

02-06 13:57

明汯投资：预测模型的发展是从简单到复杂的迭代

行业首发！浙里脱单APP搭载DeepSeek大模型

02-08 16:44

行业首发！浙里脱单APP搭载DeepSeek大模型

AI赋能高效大屏体验三星Galaxy Tab S10系列“国补”热销中

AI赋能高效大屏体验三星Galaxy Tab S10系列“国补”热销中

AI赋能高效大屏体验三星Galaxy Tab S10系列“国补”热销中

AI赋能高效大屏体验三星Galaxy Tab S10系列“国补”热销中

TOM

02-10 15:27

热点精选

预订购机享多重好礼三星Galaxy S25系列创新智能交互

TOM2025-02-11 19:4002-11 19:40

OPPO Watch X2屏幕规格出炉：亮度提升120%

安兔兔2025-02-11 18:3302-11 18:33

三星Galaxy S25系列国行正式发布：全系最低5999元起

安兔兔2025-02-11 18:3002-11 18:30

沃尔沃车型及报价：沃尔沃S60让你的职场“加速”驶向成功！

TOM2025-02-11 17:5902-11 17:59

从智能交互到AI影像三星Galaxy S25系列树立旗舰标杆

TOM2025-02-11 17:5802-11 17:58

“凌燕”闪耀“亚冬”！东航志愿者打造亚冬会亮丽风景

TOM2025-02-11 17:5802-11 17:58

生活节奏一手掌控三星Galaxy S25系列打造更好用的Bixby

TOM2025-02-11 17:5802-11 17:58

亚冬会引领冰雪产业如何 “滑” 向全民时代

中国网2025-02-11 17:4102-11 17:41

人家也是有底线的啦~

相关推荐

希沃学习机全系列接入Deepseek大模型

正式接入DeepSeek大模型，星图云服务再升级！

明汯投资：预测模型的发展是从简单到复杂的迭代

行业首发！浙里脱单APP搭载DeepSeek大模型

AI赋能高效大屏体验三星Galaxy Tab S10系列“国补”热销中

广告

TOM集团广告服务加入TOM

Copyright © 2018 TOM.COM Corporation, All Rights Reserved 新飞网版权所有