首页 > 幻觉

幻觉

  • 李彦宏:大模型基本消除幻觉,智能体是AI应用最主流形态

    “过去24个月,AI行业的最大变化是什么?我的回答一定是大模型基本消除了幻觉,回答问题的准确性大幅提升,这让AI从一本正经胡说八道,变得可用、可被信赖。”11月12日,百度创始人李彦宏在百度世界2024大会上说。在AI应用的发展趋势上,李彦宏表示,智能体是AI应用的最主流形态,即将迎来爆发点。他把做

  • 大模型传媒能力如何?新京报AI研究院报告:存幻觉,写作待提高

    打分标准为:准确性(4分):概括是否准确反映了文档内容,是否准确回答了测试人员的问题。覆盖面(3分):概括是否涵盖了文档中的所有不能遗漏的重要内容。语言表达(3分):生成内容是否流畅,概括语言是否清晰易懂。可上传文档长度和可识别文档类型(扣分项):大模型无法上传或无法识别全部内容可酌情扣分。 

  • 大模型「幻觉」,看这一篇就够了

    大模型“幻觉”,终于有系统综述了!一口气49页,详细阐述了幻觉定义、分类、导致幻觉的原因,还有检测幻觉、减轻幻觉的方法。这篇最新综述来自哈工大和华为,一po出就在网上火得不行:具体来说,文中用一套新的范畴框架来定义模型幻觉,

  • OpenAI推出通用大语言模型GPT-4.5:情商更高,幻觉更少

    鞭牛士报道,2月28日消息,OpenAI 周四宣布了通用大型语言模型 GPT-4.5 的研究预览版。它最初将向软件开发人员和 ChatGPT Pro 订阅用户开放。OpenAI 在一篇博客文章中表示,该模型呈现不准确信息的频率比之前的模型要低。OpenAI 写道:早期测试表明,与 GPT-4.5 交

  • 对话IJCAI2024大会主席张成奇:克服了幻觉,大模型就不够「靓丽」

    作者丨王悦 张进编辑丨陈彩娴第 33 届IJCAI大会在韩国济州岛圆满结束,为期一周(8.3-8.9)的 IJCAI 吸引了来自全世界各地人工智能领域的研究者和关注者,大会现场的氛围跟 8 月的济州岛天气一样火热,现场的热情氛围昭显了当下人工智能领域的蓬勃发展。延续了 IJCAI 2023,此次大会

  • 和谷歌搜索抢活,FRESHLLM「紧跟时事」,幻觉更少,信息更准

    LLM 能更新知识的话,还有谷歌搜索什么事?大型语言模型的能力有目共睹,如 BARD 和 CHATGPT/GPT-4,被设计成多功能开放域聊天机器人,可以就不同主题进行多轮对话。它们能够帮助人们完成诸多任务,但这并不代表它们是万能的。「幻觉」与过时的信息降低了这些大模型回复的可信度。尤其对于需要信息

  • 吊打DeepSeek?Grok3大模型即将发布!马斯克放话:它是地球上最聪明的AI,能自主删除错误数据,剔除大模型幻觉【附生成式AI行业现状】

    (图片来源:摄图网)近日,马斯克在社交平台X上宣布了一项重大消息:Grok 3大模型将于太平洋时间周一晚上8点(北京时间周二12点)正式发布,并将通过现场演示。马斯克对Grok 3的评价极高,称其为“地球上最聪明的人工智能”。此前,马斯克表示:“Grok 3具有极强推理能力,在我们迄今为止所做的测试

  • 开源模型「幻觉」更严重,这是三元组粒度的幻觉检测套件

    BSChecker:细粒度大模型幻觉检测工具与基准测试排行榜大模型长期以来一直存在一个致命的问题,即生成幻觉。由于数据集的复杂性,难免会包含过时和错误的信息,这使得输出质量面临着极大的挑战。过多的重复信息还可能导致大型模型产生偏见,这也算是一种形式的幻觉。

  • 李彦宏最新发声:大模型基本消除幻觉AI变得可用可信赖

    快科技11月12日消息,在今天的百度2024世界百度大会上,百度创始人李彦宏发表演讲称,大模型行业过去24个月最大的变化,就是大模型基本消除了幻觉。这也使得AI回答问题的准确性大大的提升了,“让AI从一本正经的胡说八道变得可用,可被信赖。”同时李彦宏还发布了检索增强的文生图技术iRAG,通过将百度搜