首页 > AI资讯 > 行业动态 > 有了行业大模型,腾讯为何还要推出通用大模型?

有了行业大模型,腾讯为何还要推出通用大模型?

新火种    2023-09-09

9月7日,腾讯通用大模型“混元”在2023腾讯全球数字生态大会上正式对外亮相。现场,腾讯高管演示了混元大模型功能,已接入混云大模型的有腾讯云、腾讯广告、腾讯游戏等50个业务和产品。

生态大会期间,腾讯集团副总裁蒋杰也接受了南方+记者的采访,就腾讯通用大模型的发展策略、商业路径等进行了解答。

谈应用:

在腾讯内部成为业务“磨刀石”

南方+:6月时腾讯云发布了行业大模型;混元大模型不仅在B端,还有很多C端应用场景。腾讯在整个大模型生态中的定位是怎样的?

蒋杰:腾讯在6月份先发布行业大模型,如今通用大模型正式对外亮相。其实在6月时,行业和客户就有很多关于大模型的需求,而通用大模型,除了能够支持行业已有的发布的几个行业以外,还会支持更多领域,也将作为腾讯云MaaS服务的底座,进一步服务客户。

在这几个月以来,我们一直在和腾讯内部的应用做磨炼,把腾讯重要的、丰富的业务场景当成“磨刀石”,再出来服务更多企业。比如在会议、文档的应用中,都是在一个复杂的环境之下,通过内部充分打磨,让我们对自己有信心,这是最关键的。我们希望能够让腾讯混元大模型成为“倍增器”。

南方+:通过大模型应用,你们希望起到怎样的作用?

蒋杰:腾讯会议、腾讯文档、腾讯广告等已经接入混元大模型,都有很大的用户量,并得到了深度应用。首先,我们做这个模型,一定是服务企业本身,再通过腾讯云对外服务客户和生态合作伙伴。对一个通用大模型来说,它的逻辑思维、推理能力是非常关键的。不光要具备复杂的推理能力,甚至对复杂推理能力过程中的安全问题也要有更好判断。我们希望大语言模型真正能够给我们生活带来便利、工作带来高效。

南方+:大模型的训练和存储过程中涉及到大量的个人数据和敏感数据,腾讯是如何保证这些数据的安全和隐私,避免数据的泄露和滥用?

蒋杰:这是一个隐私保护的问题,其实和大模型本身没有直接联系。无论有没有大模型,腾讯都严格遵循法律要求,不光是我们做小模型、大模型甚至大语言模型,都不会使用个人隐私数据。此外,腾讯的内容产品,也为腾讯混元大模型提供了大规模、高质量、多样化的语料库,能够学习到各类应用场景中丰富的语言知识和语境理解能力。

谈商业化:

从自用到位客户提供定制化方案

南方+:如何看待大模型的商业化问题?

蒋杰:大模型面向TO B短期会产生很好的商业收入,我认为这还有待探索,因为大模型的成熟度和应对复杂任务的处理能力还不够,它还有很多严肃场景、专业场景,还不能解锁的时候,其实它的应用场景还是非常有限,需要我们企业甚至业界各个团队甚至学术界一起完善。腾讯的混元大模型体系,一开始就是根据腾讯企业自身的应用去做的研发,再和大模型更深度结合应用,才能够去抵消整个大模型高昂的设备、训练、人员的成本。

南方+:在商业化上是否有比较清晰的路径?

蒋杰:我觉得首先是做好技术本身,回归技术本质,至于商业化,我们会把混元大模型所有能力开放给腾讯所有业务,内部都是公开,都在腾讯的机器学习平台上使用并迭代应用。比如和腾讯文档、腾讯会议合作,都是和各个业务做深度结合来做对外发布,混元大模型还要做更多的数据标注、更多的框架、训练更多的数据。在我们内部,其实可以把混元看作一个在内部开源的模型,每一个公司的内部业务都可以看到混元的能力,他们基于这个能力做应用;面向TO B端则会通过腾讯云API对外开放。未来,如果每个行业需要做深度定制,腾讯云也会为大家提供服务。

谈自研:

对技术完全掌握才能更好迭代

蒋杰:为什么要做全链路自研?其实也有很多的开源模型,借助很多开源模型就可以在上面做一些叠加,但是,如果不从头做自研,其实也不会对技术完全掌握,比如说这个模型别人训练好了,但是有一些违法有害信息存在的时候,回答是错误的,你也没法在其中做更多的修改,同时,迭代、研发能更快,还有更适合未来腾讯的技术栈的融入。

腾讯从高速网络、最底层的服务器到网卡、高速组网,以及平台、模型、算法都是自研的,这种自研其实给我们后续的迭代,是可以加快的。同时,还和其他业务深度结合也会加快。可以这么说,腾讯有一个海量高并发的业务,开源的很多架构是不适应腾讯的业务体量,所以我们一定要走出一套基于自主体系的研发道路,才能应对海量高并发的业务冲击式。

南方+:成本和效果上会给客户带来哪些优化?

蒋杰:现在大模型的成本其实还是腾讯自己来扛掉,所以成本一定是高昂的,但是我们希望不断降成本,从训练的效率和框架上降成本,在服务用户的推理阶段中降成本,未来我们也会做一些定制化方式来让客户的成本降到最低。

南方+:整个研发过程中,面临的技术挑战主要有什么?

蒋杰:其实从2021年开始研发,今天我们所看到的结果不是一下子就有的。首先,它要做底层训练的框架,否则也装不下千亿级参数、2万亿tokens的能力。整个体系在平台架构、模型、算法都是自研的。我们最早不是一个稠密的大模型,而是基于稀疏的大模型,广告业务做到了一个稀疏大模型来支撑广告业务。这个过程中腾讯一直在不断加大投入这些技术能力。最近的研发也在做一些更有深度的能力演进,不但在工业界,也会在学术界提升应用实践能力。

南方+记者 郜小平

【作者】 郜小平

【来源】 南方报业传媒集团南方+客户端

相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。