有了行业大模型，腾讯为何还要推出通用大模型？

首页 > AI资讯 > 行业动态 > 有了行业大模型，腾讯为何还要推出通用大模型？

有了行业大模型，腾讯为何还要推出通用大模型？

新火种 2023-09-09

9月7日，腾讯通用大模型“混元”在2023腾讯全球数字生态大会上正式对外亮相。现场，腾讯高管演示了混元大模型功能，已接入混云大模型的有腾讯云、腾讯广告、腾讯游戏等50个业务和产品。

生态大会期间，腾讯集团副总裁蒋杰也接受了南方+记者的采访，就腾讯通用大模型的发展策略、商业路径等进行了解答。

谈应用：

在腾讯内部成为业务“磨刀石”

南方+：6月时腾讯云发布了行业大模型；混元大模型不仅在B端，还有很多C端应用场景。腾讯在整个大模型生态中的定位是怎样的？

蒋杰：腾讯在6月份先发布行业大模型，如今通用大模型正式对外亮相。其实在6月时，行业和客户就有很多关于大模型的需求，而通用大模型，除了能够支持行业已有的发布的几个行业以外，还会支持更多领域，也将作为腾讯云MaaS服务的底座，进一步服务客户。

在这几个月以来，我们一直在和腾讯内部的应用做磨炼，把腾讯重要的、丰富的业务场景当成“磨刀石”，再出来服务更多企业。比如在会议、文档的应用中，都是在一个复杂的环境之下，通过内部充分打磨，让我们对自己有信心，这是最关键的。我们希望能够让腾讯混元大模型成为“倍增器”。

南方+：通过大模型应用，你们希望起到怎样的作用？

蒋杰：腾讯会议、腾讯文档、腾讯广告等已经接入混元大模型，都有很大的用户量，并得到了深度应用。首先，我们做这个模型，一定是服务企业本身，再通过腾讯云对外服务客户和生态合作伙伴。对一个通用大模型来说，它的逻辑思维、推理能力是非常关键的。不光要具备复杂的推理能力，甚至对复杂推理能力过程中的安全问题也要有更好判断。我们希望大语言模型真正能够给我们生活带来便利、工作带来高效。

南方+：大模型的训练和存储过程中涉及到大量的个人数据和敏感数据，腾讯是如何保证这些数据的安全和隐私，避免数据的泄露和滥用？

蒋杰：这是一个隐私保护的问题，其实和大模型本身没有直接联系。无论有没有大模型，腾讯都严格遵循法律要求，不光是我们做小模型、大模型甚至大语言模型，都不会使用个人隐私数据。此外，腾讯的内容产品，也为腾讯混元大模型提供了大规模、高质量、多样化的语料库，能够学习到各类应用场景中丰富的语言知识和语境理解能力。

谈商业化：

从自用到位客户提供定制化方案

南方+：如何看待大模型的商业化问题？

蒋杰：大模型面向TO B短期会产生很好的商业收入，我认为这还有待探索，因为大模型的成熟度和应对复杂任务的处理能力还不够，它还有很多严肃场景、专业场景，还不能解锁的时候，其实它的应用场景还是非常有限，需要我们企业甚至业界各个团队甚至学术界一起完善。腾讯的混元大模型体系，一开始就是根据腾讯企业自身的应用去做的研发，再和大模型更深度结合应用，才能够去抵消整个大模型高昂的设备、训练、人员的成本。

南方+：在商业化上是否有比较清晰的路径？

蒋杰：我觉得首先是做好技术本身，回归技术本质，至于商业化，我们会把混元大模型所有能力开放给腾讯所有业务，内部都是公开，都在腾讯的机器学习平台上使用并迭代应用。比如和腾讯文档、腾讯会议合作，都是和各个业务做深度结合来做对外发布，混元大模型还要做更多的数据标注、更多的框架、训练更多的数据。在我们内部，其实可以把混元看作一个在内部开源的模型，每一个公司的内部业务都可以看到混元的能力，他们基于这个能力做应用；面向TO B端则会通过腾讯云API对外开放。未来，如果每个行业需要做深度定制，腾讯云也会为大家提供服务。

谈自研：

对技术完全掌握才能更好迭代

蒋杰：为什么要做全链路自研？其实也有很多的开源模型，借助很多开源模型就可以在上面做一些叠加，但是，如果不从头做自研，其实也不会对技术完全掌握，比如说这个模型别人训练好了，但是有一些违法有害信息存在的时候，回答是错误的，你也没法在其中做更多的修改，同时，迭代、研发能更快，还有更适合未来腾讯的技术栈的融入。

腾讯从高速网络、最底层的服务器到网卡、高速组网，以及平台、模型、算法都是自研的，这种自研其实给我们后续的迭代，是可以加快的。同时，还和其他业务深度结合也会加快。可以这么说，腾讯有一个海量高并发的业务，开源的很多架构是不适应腾讯的业务体量，所以我们一定要走出一套基于自主体系的研发道路，才能应对海量高并发的业务冲击式。

南方+：成本和效果上会给客户带来哪些优化？

蒋杰：现在大模型的成本其实还是腾讯自己来扛掉，所以成本一定是高昂的，但是我们希望不断降成本，从训练的效率和框架上降成本，在服务用户的推理阶段中降成本，未来我们也会做一些定制化方式来让客户的成本降到最低。

南方+：整个研发过程中，面临的技术挑战主要有什么？

蒋杰：其实从2021年开始研发，今天我们所看到的结果不是一下子就有的。首先，它要做底层训练的框架，否则也装不下千亿级参数、2万亿tokens的能力。整个体系在平台架构、模型、算法都是自研的。我们最早不是一个稠密的大模型，而是基于稀疏的大模型，广告业务做到了一个稀疏大模型来支撑广告业务。这个过程中腾讯一直在不断加大投入这些技术能力。最近的研发也在做一些更有深度的能力演进，不但在工业界，也会在学术界提升应用实践能力。

南方+记者郜小平

【作者】郜小平

【来源】南方报业传媒集团南方+客户端

Tags:

大模型模型行业

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

有了行业大模型，腾讯为何还要推出通用大模型？

中金：维持阿里巴巴-SW“跑赢行业”评级，目标价109港元

华知大模型5.0发布

三个大模型组队挑战o1，实测360多模型协作干掉提示词工程

浩鲸科技鲸智BI大模型发布，从算法炫技到价值落地

腾讯元器推出智能体新应用，支持公众号主打造专属大模型数字分身

热门文章