AI靠谱度哪家强?这份全国首份大模型安全榜单话你知

近日,中山大学软件工程学院推出并更新“TrustedGPT”大模型可信性评测平台及排行榜。该榜单对标国家《人工智能安全治理框架》,旨在构建科学、动态的量化评估体系,为行业树立安全发展的“风向标”。

TrustedGPT平台是中山大学软件工程学院赋能地方AI产业的重要举措。该学院依托珠海市可信大模型重点实验室,已构建覆盖金融、电力、中医等领域的垂域大模型体系。此次发布的可信榜,不仅是国内首个系统性量化评测大模型安全性的榜单,更成为连接技术发展与政策监管的桥梁。

该平台从“能力可靠、输出可信、安全可控”三大核心维度出发,细分为指令遵循、输出真实性、价值观对齐等52种测评维度,覆盖公平性、鲁棒性、越狱安全性等八大核心安全指标。支持21种国内外主流大模型的接入与评测,既包括ChatGPT、智谱AI等闭源模型,也涵盖Deepseek、Qwen、LLaMA等开源模型。基于超320万条中英文评测数据和118个评测数据集,平台对37个主流大模型进行深度“体检”,并定期更新榜单。

其发布的最新排行榜显示,闭源模型竞争力强劲,OpenAI的gpt-4-turbo以88.69分位居榜首,百度的ERNIE-4.0-8K-Latest紧随其后。开源模型中,深度求索的deepseek-r1以87.13分位列第三,阿里巴巴的qwen2-72b-instruct也表现不俗。

评测结果还显示,尽管头部模型在基础可信指标上建立优势,但整体“偏科”现象明显,尚无“全能型”选手。部分模型内容合规得分高,却难防“越狱”诱导攻击;另一些逻辑推理能力强的模型,在隐私保护、版权合规上存在短板。中尾部模型更在多项核心安全指标上表现乏力。这种“单点突出、全局失衡”的现状,直观展示了大模型从“功能可用”迈向“全面可信”的技术瓶颈。

据了解,中山大学软件工程学院该通过TrustedGPT为监管提供风险研判依据,倒逼企业优化安全机制,助力构建安全、可信、可控的AI生态,为粤港澳大湾区人工智能产业高质量发展提供坚实支撑。

文字:宋雪梅 编辑:卢伟 责任编辑:王朝辉
AI靠谱度哪家强?这份全国首份大模型安全榜单话你知
观海融媒 2026-03-11 19:53

近日,中山大学软件工程学院推出并更新“TrustedGPT”大模型可信性评测平台及排行榜。该榜单对标国家《人工智能安全治理框架》,旨在构建科学、动态的量化评估体系,为行业树立安全发展的“风向标”。

TrustedGPT平台是中山大学软件工程学院赋能地方AI产业的重要举措。该学院依托珠海市可信大模型重点实验室,已构建覆盖金融、电力、中医等领域的垂域大模型体系。此次发布的可信榜,不仅是国内首个系统性量化评测大模型安全性的榜单,更成为连接技术发展与政策监管的桥梁。

该平台从“能力可靠、输出可信、安全可控”三大核心维度出发,细分为指令遵循、输出真实性、价值观对齐等52种测评维度,覆盖公平性、鲁棒性、越狱安全性等八大核心安全指标。支持21种国内外主流大模型的接入与评测,既包括ChatGPT、智谱AI等闭源模型,也涵盖Deepseek、Qwen、LLaMA等开源模型。基于超320万条中英文评测数据和118个评测数据集,平台对37个主流大模型进行深度“体检”,并定期更新榜单。

其发布的最新排行榜显示,闭源模型竞争力强劲,OpenAI的gpt-4-turbo以88.69分位居榜首,百度的ERNIE-4.0-8K-Latest紧随其后。开源模型中,深度求索的deepseek-r1以87.13分位列第三,阿里巴巴的qwen2-72b-instruct也表现不俗。

评测结果还显示,尽管头部模型在基础可信指标上建立优势,但整体“偏科”现象明显,尚无“全能型”选手。部分模型内容合规得分高,却难防“越狱”诱导攻击;另一些逻辑推理能力强的模型,在隐私保护、版权合规上存在短板。中尾部模型更在多项核心安全指标上表现乏力。这种“单点突出、全局失衡”的现状,直观展示了大模型从“功能可用”迈向“全面可信”的技术瓶颈。

据了解,中山大学软件工程学院该通过TrustedGPT为监管提供风险研判依据,倒逼企业优化安全机制,助力构建安全、可信、可控的AI生态,为粤港澳大湾区人工智能产业高质量发展提供坚实支撑。

文字:宋雪梅 编辑:卢伟 责任编辑:王朝辉