LENS:利用大语言模型解决计算机视觉问题
品玩6月30日讯,据 Arxiv 页面显示,Contextual AI 与斯坦福大学近日联手公布一款名为LENS的产品,旨在利用大语言模型的能力来解决计算机视觉问题。
研发团队表示,LENS 使用大语言模型来对一组独立的、高度描述的视效模块的输出进行推理,以提供对图像的详尽信息。
研究团队表示,使用 LENS 的大语言模型在大部分场景中都表现出了高度的竞争力,而不需要任何多模态训练。
相关推荐
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。