讯飞星火大模型即将更新,支持长文本、长图文、长语音
4月22日,科大讯飞宣布,旗下讯飞星火大模型即将于4月26日推出V3.5的更新版本,除了长文本,讯飞星火V3.5还将支持长图文和长语音。一个月前,科大讯飞副总裁、研究院院长刘聪曾表示,星火大模型将在今
4月22日,科大讯飞宣布,旗下讯飞星火大模型即将于4月26日推出V3.5的更新版本,除了长文本,讯飞星火V3.5还将支持长图文和长语音。一个月前,科大讯飞副总裁、研究院院长刘聪曾表示,星火大模型将在今
北京报道近日,微软斥资160亿美元收购智能语音技术公司Nuance的交易,已获得了美国反垄断批准。今年4月,这笔微软史上第二大规模的收购案的公开,给作为人工智能(AI)重要技术分支的智能语音赛道带来了不少关注。清华大学人工智能研究院听觉智能研究中心主任郑方在接受
近日,米哈游创始人蔡浩宇的二次创业公司,公布了其首个AI游戏项目。 游戏名为《Whispers from the Star》。
前沿技术的比拼中,人才极为重要。 10月24日,《每日经济新闻》记者从“月之暗面”公司方面证实,业界顶尖的语音技术专家——微软亚洲研究院前首席研究经理谭旭已正式加入月之暗面,将和团队一起为Kimi用户研发更加先进和好用的智能助手。
【CNMO新闻】近日,OpenAI官网发布消息称,将对旗下AI大模型ChatGPT进行重大升级。在接下来的两周内,将在ChatGPT中向Plus和Enterprise用户推出语音和图像。语音将在iOS和Android上推出,图像将在所有平台上提供。ChatGPT 根据官网介绍,ChatGPT新
1月20日消息,今日,字节跳动豆包大模型团队宣布,豆包实时语音大模型今日正式上线,并在豆包App全量开放,将App升级至7.2.0版本即可体验。据介绍,豆包实时语音大模型是一款语音理解和生成一体化的模型,实现了端到端语音对话。
今天,OpenAI发布了实时 API 公开测试版,用于构建基于GPT-4o语音到语音的AI应用和智能体,所有付费的开发者都能在应用程序中构建低延迟、多模态的实时互动体验。同时OpenAI 还公布了3家语音API合作者LiveKit、Agora、Twilio。其中Agora的兄弟公司是声网,两家公司在
Meta的大规模多语言语音 (MMS) 项目将彻底改变语音技术,使用wav2vec 2.0的自监督学习,MMS将语音技术扩展到1100到4000种语言。在语音方面,Meta又达到了另一个LLaMA级的里程碑。
5月23日消息,饿了么商家中心公众号发文称,其智能化商家经营体系已帮助数十万商户显著提升运营效率。该体系整合了多项AI产品工具,覆盖从开店到日常经营的全链路场景。
Soul作为新型社交平台,自上线以来一直致力于以创新的技术方案和产品设计,实现社交体验的拓展。在AI技术快速发展的背景下,Soul率先探索AI与社交的融合,系统推进其在智能对话、语音技术、虚拟人等AIGC关键技术能力研发工作,并推动AI能力在社交场景的深度落地。