当视觉大模型陷入认知失调,马里兰大学构建了一个幻觉自动生成框架
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfen
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfen
依托数据、平台、知识增强等优势 夸克大模型大幅降低问答幻觉率“大模型时代,夸克有巨大机会创造出革新性搜索产品。”11月22日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示,夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单,夸克百亿级参数大模型同样在法律、
当前,全球人工智能技术发展迅速,大模型成为行业关注重点。但大模型普遍存在的“AI幻觉”问题,影响其准确性和可靠性。
OpenAI的AI语音转写工具,那个号称近乎“人类水平”的Whisper,被曝幻觉严重——100多小时转录,被工程师发现约一半都在瞎扯。更严重的是,美联社还爆料有医疗机构利用Whisper来转录医生与患者的会诊,瞬间引发大量网友关注。
今年全国两会,全国人大代表刘庆峰关注“人工智能+”所带来的新质生产力。他建议,加快构建国产算力平台上的自主可控大模型及产业生态;预防大模型生成“幻觉数据”充斥互联网带来的危害,从技术研发和管理机制上构建可信的信息环境;丰富和优化“以旧换新”等政策推动AI智能终端产业发展。
“幻觉是大模型与生俱来的一种特点,不是缺点,没有幻觉的大模型没有智能性。”11月20日,世界互联网大会乌镇峰会期间,360创始人周鸿祎在接受媒体采访时表示,“互联网下一个五年到十年的方向已经明确的写出来了,就是人工智能和大语言模型。”周鸿祎表示,他坦言,目前中国大模型产业在算力芯片和数据上仍面临一定
计算机视觉机器之心报道排行榜一出,高下立见。人工智能发展进步神速,但问题频出。OpenAI 新出的 GPT 视觉 API 前脚让人感叹效果极好,后脚又因幻觉问题令人不禁吐槽。幻觉一直是大模型的致命缺陷。由于数据集庞杂,其中难免会有过时、错误的信息,导致输出质量面临着严峻的考验。
3月24日消息,知乎直答作为依托于社区的AI工具,积累了知乎社区海量专业讨论、超5000万篇文献知识库的内容优势,并通过接入DeepSeek实现推理能力升级。知乎宣布,知乎直答现已焕新升级,在内容和算法基础上,进一步挖掘人的专业价值,强化AI与社区,尤其是与创作者的融合。
12月19日,百川智能宣布开放基于搜索增强的Baichuan2-Turbo系列API,包含Baichuan2-Turbo-192K及Baichuan2-Turbo。这是9月末Baichuan2-53B第一次向外界打开API之后,百川智能在B端的进一步动作。
“这两年,行业最大的变化是大模型基本消除了幻觉,回答问题的准确性大幅提升,AI从一本正经的胡说八道,变得可用、可被信赖。”11月12日,百度世界2024大会上,百度创始人李彦宏给出了自己对大模型行业的回顾。 这意味着,在推动以大模型为基础的AI应用生态,已经到了爆发的前夜。而智能体已然成为百度深耕