首页 > AI资讯 > 最新资讯 > 研究发现:ChatGPT隐藏受版权保护训练数据

研究发现:ChatGPT隐藏受版权保护训练数据

新火种    2023-09-01

文章概要:

1. 据新研究,ChatGPT试图隐瞒训练过程中使用了受版权保护材料。

2. 其表现为,当用户试图提取下一个句子时,ChatGPT会扰乱输出。

3. 研究人员认为ChatGPT检测提示意图并采取措施,但仍使用受版权保护材料。

新火种 8月24日 消息:据BusinessInsider报道,最近,ByteDance的AI科学家团队在论文中公布了一项新研究,内容是ChatGPT试图隐瞒自己是通过大量受版权保护的材料进行训练的。

研究人员发现,当用户尝试通过提示提取下一句时,ChatGPT会故意扰乱输出,而此前版本不存在这样的行为。

研究人员推测,ChatGPT的开发者实现了一种机制,可以检测提示是否意图提取版权内容。但是即使采取了这些措施,研究还是发现ChatGPT会用受版权保护的材料回应某些提示。

事实上,不仅ChatGPT,其他大语言模型如Meta的OPT-1.3B和谷歌的FLAN-T5也被发现会用受版权保护的文本回应提示。

研究人员分析,这是因为这些大语言模型都是通过训练大量文本数据获得能力的,包括书籍、文章和网站中的文字。这些训练数据通常包含受版权保护的内容,大语言模型可能会无意中复制这些内容。

Tags:
相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

热门文章