重磅！“大模型可信能力评测排行榜”全国首发

近日，" 大湾区生成式人工智能安全发展联合实验室 " 全国首发 " 大模型可信能力评测排行榜 "，阿里巴巴 "Qwen2-72b"、百度 "Ernie-4.0" 等一批知名企业的大模型上榜。

国内首家落地对标《人工智能安全治理框架》1.0 版评测体系

日前，全国 *** 安全标准化技术委员会在国家 *** 安全宣传周主论坛上正式发布了《人工智能安全治理框架》1.0 版（简称《框架》）。这一框架不仅是一项技术性文件，更是对全球人工智能治理的新实践，意在为中国及全球 AI 技术的安全、可靠和可持续发展提供指引。

" 大湾区生成式人工智能安全发展联合实验室 "（简称 " 联合实验室 "）根据《框架》" 包容审慎、确保安全，风险导向、敏捷治理，技管结合、协同应对，开放合作、共治共享 " 的原则以及技术和治理两方面的防范措施，研究制定了国内首款对标《框架》的大模型安全可信及量化评级测评体系。该评测体系结合《生成式人工智能服务管理暂行办法》和《生成式人工智能服务安全基本要求》，重点对标《框架》，从价值对齐、安全可控和能力可靠三个主要方向和 13 个细分维度，对模型的生成内容及行为进行全面评估。

全国率先发布 " 大模型可信能力评测排行榜 "

" 联合实验室 " 选取了国内外 22 个最新大模型作为评测对象，包括 17 个国内模型和 5 个国外模型（华为、腾讯作为 " 联合实验室 " 联合建设单位，其模型不参与评测），按照 13 个维度的评测体系进行了全面客观评测，评测数据集超过 3.4 万条数据，支持中文和英文两种语言，最终形成了 " 大模型可信能力评测排行榜 "。

国内大模型可信评测榜单

国外大模型可信评测榜单

评测结果显示，国内大模型在可信能力评测中展现了较强的竞争力，顶尖模型在各可信维度上的差距较小，其中 88.2% 的模型在整体 13 个可信维度中达到了 10A 及以上水平。整体来看，国内大模型在可信能力上表现突出，尤其在价值对齐和安全可控方面，反映出国内技术的稳步提升以及对政策和法规的高度适应性。例如，在价值对齐的五个维度中，17 个模型中的 16 个至少达到了 4A 水平（94.1%），但仅有 4 个模型达到了 5A 水平（23.5%），表明仍有进一步优化的空间。在安全可控维度的四个分项中，3 个模型达到 3A，其余 14 个达 4A，占比 82.4%。

然而，评测结果也揭示了一些不足，尤其是在能力可靠性的四个维度上，模型评级从 1A 到 4A 不等，仅有 29.4% 的模型达到了 4A。这主要是由基座模型能力的差异引起的，表明模型在基础能力、一致性和稳定性方面仍有提升空间。此外，开源大模型 Llama-3.1 在价值对齐、安全可控等可信能力方面与领先的闭源大模型相比，仍存在显著差距，需要进一步优化。

价值对齐评测结果

安全可控评测结果

能力可靠评测结果

" 大湾区生成式人工智能安全发展联合实验室 " 介绍

" 大湾区生成式人工智能安全发展联合实验室 " 由 *** 广东省委网信办和国家互联网应急中心广东分中心联合牵头发起，华为公司、腾讯公司、中山大学、广州市委网信办、深圳市委网信办、东莞市委网信办以及深圳河套发展署共同参与建设。" 联合实验室 " 致力于人工智能潜在风险的评测研判、前瞻预防和约束引导研究，为人工智能可靠、可控、安全发展探索治理范式，积极服务生成式人工智能创新发展，有力支撑人工智能时代的 *** 综合治理体系建设，共同促进人工智能 " 以人为本、向善而行 "，努力以高水平的安全助力数字经济更高质量发展。

重磅！“大模型可信能力评测排行榜”全国首发

你可能感兴趣的

发表评论