中国信通院发起大模型幻觉测试，总体涉及五种测试维度

首页 > AI资讯 > 最新资讯 > 中国信通院发起大模型幻觉测试，总体涉及五种测试维度

中国信通院发起大模型幻觉测试，总体涉及五种测试维度

新火种 2025-05-12

经济观察网讯 3月19日，据中国信通院消息，中国信息通信研究院人工智能所基于前期的AI Safety Benchmark测评工作，发起大模型幻觉测试。本轮幻觉测试工作将以大语言模型为测试对象，涵盖了事实性幻觉和忠实性幻觉两种幻觉类型。测试数据包含7000余条中文测试样本，测试形式包括对应于忠实性幻觉检测的信息抽取与知识推理两类题型，以及对应事实性幻觉检测的事实判别题型。总体涉及人文科学、社会科学、自然科学、应用科学和形式科学五种测试维度。（编辑万佳）

Tags:

深度学习测试维度

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

中国信通院发起大模型幻觉测试，总体涉及五种测试维度

独家丨字节大模型全员会，朱文佳和吴永辉一起聊了方向、组织和开源

洗衣机用上AI大模型！冰箱亮出锁鲜大招，TCL冰洗黑科技燃爆AWE上海

上海浦东：将聚焦人形机器人、大模型等赛道，打造特色园区地标

从烧钱到落地，大模型到了该“验收”的时候

AI赋能水域经济武汉控股发布行业首创大模型+智能机器人

热门文章