AI靠谱度哪家强？这份全国首份大模型安全榜单话你知

宋雪梅 2026-03-11 19:53

近日，中山大学软件工程学院推出并更新“TrustedGPT”大模型可信性评测平台及排行榜。该榜单对标国家《人工智能安全治理框架》，旨在构建科学、动态的量化评估体系，为行业树立安全发展的“风向标”。

TrustedGPT平台是中山大学软件工程学院赋能地方AI产业的重要举措。该学院依托珠海市可信大模型重点实验室，已构建覆盖金融、电力、中医等领域的垂域大模型体系。此次发布的可信榜，不仅是国内首个系统性量化评测大模型安全性的榜单，更成为连接技术发展与政策监管的桥梁。

该平台从“能力可靠、输出可信、安全可控”三大核心维度出发，细分为指令遵循、输出真实性、价值观对齐等52种测评维度，覆盖公平性、鲁棒性、越狱安全性等八大核心安全指标。支持21种国内外主流大模型的接入与评测，既包括ChatGPT、智谱AI等闭源模型，也涵盖Deepseek、Qwen、LLaMA等开源模型。基于超320万条中英文评测数据和118个评测数据集，平台对37个主流大模型进行深度“体检”，并定期更新榜单。

其发布的最新排行榜显示，闭源模型竞争力强劲，OpenAI的gpt-4-turbo以88.69分位居榜首，百度的ERNIE-4.0-8K-Latest紧随其后。开源模型中，深度求索的deepseek-r1以87.13分位列第三，阿里巴巴的qwen2-72b-instruct也表现不俗。

评测结果还显示，尽管头部模型在基础可信指标上建立优势，但整体“偏科”现象明显，尚无“全能型”选手。部分模型内容合规得分高，却难防“越狱”诱导攻击；另一些逻辑推理能力强的模型，在隐私保护、版权合规上存在短板。中尾部模型更在多项核心安全指标上表现乏力。这种“单点突出、全局失衡”的现状，直观展示了大模型从“功能可用”迈向“全面可信”的技术瓶颈。

据了解，中山大学软件工程学院该通过TrustedGPT为监管提供风险研判依据，倒逼企业优化安全机制，助力构建安全、可信、可控的AI生态，为粤港澳大湾区人工智能产业高质量发展提供坚实支撑。

文字：宋雪梅编辑：卢伟责任编辑：王朝辉

AI靠谱度哪家强？这份全国首份大模型安全榜单话你知

观海融媒 2026-03-11 19:53

文字：宋雪梅编辑：卢伟责任编辑：王朝辉