首页 > 幻觉

幻觉

  • 开源模型「幻觉」更严重,这是三元组粒度的幻觉检测套件

    BSChecker:细粒度大模型幻觉检测工具与基准测试排行榜大模型长期以来一直存在一个致命的问题,即生成幻觉。由于数据集的复杂性,难免会包含过时和错误的信息,这使得输出质量面临着极大的挑战。过多的重复信息还可能导致大型模型产生偏见,这也算是一种形式的幻觉。

  • 大模型幻觉率排行:GPT

    大盘鸡排行榜一出,高下立见。人工智能发展进步神速,但问题频出。OpenAI 新出的 GPT 视觉 API 前脚让人感叹效果极好,后脚又因幻觉问题令人不禁吐槽。幻觉一直是大模型的致命缺陷。由于数据集庞杂,其中难免会有过时、错误的信息,导致输出质量面临着严峻的考验。

  • 能减少所谓“AI幻觉”?训练大模型,OpenAI花钱买新闻

    【环球时报驻德国特约记者 青木 环球时报记者 刘明】能减少所谓“人工智能(AI)幻觉”?拥有美国“商业内幕”网站和“政治新闻网”等媒体的出版商阿克塞尔·施普林格集团13日宣布,该公司与美国“开放人工智能研究中心”(OpenAI)达成里程碑式合作,OpenAI将向其付费购买新闻。美国《纽约邮报》13日

  • 依托数据、平台、知识增强等优势夸克大模型大幅降低问答幻觉率

    依托数据、平台、知识增强等优势 夸克大模型大幅降低问答幻觉率“大模型时代,夸克有巨大机会创造出革新性搜索产品。”11月22日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示,夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单,夸克百亿级参数大模型同样在法律、

  • 大模型幻觉率排行:GPT-4 3%最低,谷歌Palm竟然高达27.2%

    计算机视觉机器之心报道排行榜一出,高下立见。人工智能发展进步神速,但问题频出。OpenAI 新出的 GPT 视觉 API 前脚让人感叹效果极好,后脚又因幻觉问题令人不禁吐槽。幻觉一直是大模型的致命缺陷。由于数据集庞杂,其中难免会有过时、错误的信息,导致输出质量面临着严峻的考验。

  • 天工大模型登顶多模态榜单!解决幻觉、跨语言两大难题

    声明:本文来自于国产大模型,登顶多模态榜单!昆仑万维最近在大模型圈可谓“风生水起”。几天前刚被曝挖来了AI大牛颜水成,出任天工智能联席CEO。现在,其「天工」大模型Skywork-MM又登顶多模态榜单,在腾讯优图实验室联合厦门大学开展的多模态大语言模型(Multimodal Large Langua

  • 幻觉率直降40%,中国电信千亿参数「星辰大模型」炸场,业界首提缓解多轮幻觉解决方案

    经历了 2023 年「百模大战」的洗礼,不管是国内还是海外,不管是开源还是闭源,各家大模型都从追赶和超越中获得了实质的进步。在语言、语音、视觉领域,大模型已经获得了强大的生成能力,不仅能在几秒钟之内生成非常合理的内容,甚至可以媲美拥有多年技能和知识储备的专家。

  • 同济、复旦大学联手发布rag,解决大模型幻觉问题

    品玩12月26日讯,据 Arxiv 页面显示,同济大学近日联手复旦大学研究团队,提出了一种名为“检索增强生成(RAG)”的方法,旨在解决大模型幻觉、知识更新缓慢和答案透明度不足等问题。论文显示,RAG在回答问题之前,会从外部知识库中检索相关信息,以提高答案的准确性,减少模型的幻觉,尤其适用于知识密集