首页 > 幻觉

幻觉

  • 幻觉率直降40%,中国电信千亿参数「星辰大模型」炸场,业界首提缓解多轮幻觉解决方案

    经历了 2023 年「百模大战」的洗礼,不管是国内还是海外,不管是开源还是闭源,各家大模型都从追赶和超越中获得了实质的进步。在语言、语音、视觉领域,大模型已经获得了强大的生成能力,不仅能在几秒钟之内生成非常合理的内容,甚至可以媲美拥有多年技能和知识储备的专家。

  • 同济、复旦大学联手发布rag,解决大模型幻觉问题

    品玩12月26日讯,据 Arxiv 页面显示,同济大学近日联手复旦大学研究团队,提出了一种名为“检索增强生成(RAG)”的方法,旨在解决大模型幻觉、知识更新缓慢和答案透明度不足等问题。论文显示,RAG在回答问题之前,会从外部知识库中检索相关信息,以提高答案的准确性,减少模型的幻觉,尤其适用于知识密集

  • MetaGPT:多个AI聊天机器人协作框架 减轻人工智能幻觉

    文章概要:1. MetaGPT利用SOPs减少语言模型的幻觉风险2. 将复杂任务分解成多个子任务,每个子任务对应一个代理3. 多个代理之间协作,避免自由对话中出现偏差新火种(xinhuozhong.com)8月28日 消息:MetaGPT 是一种将多个大型语言模型(LLM)的聊天机器人连接起来的框架

  • 大模型幻觉成应用落地难题评测显示文心一言解决幻觉应对能力好

    大模型的“幻觉”问题,是其行业落地的核心挑战之一。例如幻觉会影响生成内容的可靠性,对于法律、金融、医疗等专业要求高的领域,将难以完成实际场景任务。因此,大模型幻觉问题也被认为是制约大模型广泛应用的一大难题。近日,复旦大学与上海人工智能实验室构建了针对中文大模型的幻觉评测数据集HalluQA,

  • 美国执念抹黑他国恰似人工智能“幻觉”

    “幻觉”,在人工智能领域是一个专业术语,被用于描述机器可能输出“无中生有”的内容。这样的“幻觉”也出现在一些美国政客身上,他们无中生有地污称中国用人工智能技术收集美国人数据。治疗这种“幻觉”,美国一些人要好好照照镜子。

  • 腾讯混元参战大模型:“幻觉率”可降低30%,多个指标超越GPT3.5

    腾讯混元大模型logo。视觉中国 图“百模大战”新增又一巨头:腾讯官宣参战。9月7日,在2023腾讯全球数字生态大会上,腾讯正式发布混元大模型,并宣布通过腾讯云对外开放。资料显示,腾讯混元大模型是腾讯自研的一款通用大模型,目前已经接入腾讯50多个业务测试,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技

  • GalileoLab推出检测AI幻觉的新指标

    划重点:- Galileo Lab 的新指标可以帮助改进生成 AI 的准确性,检测 AI 幻觉问题。- OpenAI GPT-4在基本问答任务中有大约23% 的幻觉倾向,其他模型则更差,达到60%。- Galileo Labs 开发的新指标包括正确性和上下文一致性,可以帮助企业在其 AI 实现中测试

  • 最新评测对主流大模型幻觉问题进行了评估

    如何准确评估和解决大语言模型中的幻觉问题已成为一个至关重要的挑战。近日,复旦大学与上海人工智能实验室构建了针对中文大模型的幻觉评测数据集HalluQA,对业界主流的大模型进行了评估。   HalluQA采用无幻觉率来评估大模型的优劣。无幻觉率越高代表模型幻觉越低,事实准确性越高。

  • 阿里达摩院提出“知识链”框架,逐步纠错降低大模型幻觉

    阿里巴巴达摩院(湖畔实验室)、新加坡南洋理工大学等联合提出了大模型知识链(CoK)框架。该框架可实时检索异构知识源并逐步纠正推理错误,进一步提高大模型问答知识型问题的准确率,降低幻觉现象。在通用知识、