首页 > 语音

语音

  • 奔驰发布全新MB.OS信息娱乐系统,加入AI语音助手

    IT之家 1 月 9 日消息,在 2024 年 CES 展上,梅赛德斯-奔驰发布了全新 MB.OS 信息娱乐系统,并宣布其首发车型将是梅赛德斯-奔驰 CLA 概念车的量产版,之后将逐步搭载于基于全新 MMA 平台打造的多个车型上。IT之家注意到,新系统的一大亮点是全新 MBUX 虚拟助理的加入,官方

  • OpenAI发布GPT-4o:可免费开放使用语音对话媲美真人

    5月14日消息,在今天凌晨的OpenAI发布会上,最新升级的大模型GPT-4o正式发布。GPT-4o的“o”代表“omni”。该词意为“全能”,源自拉丁语“omnis”,在英语中“omni”常被用作词根,用来表示“全部”或“所有”的概念。GPT-4o可以实时对音频、视觉和文本进行推理,能处理超过50

  • 昆仑万维推出天工大模型4.04o版实时语音对话助手Skyo上线在即

    中证网讯(王珞)11月20日,昆仑万维正式推出天工大模型4.0 4o版(Skywork 4o),以及新产品实时语音对话助手Skyo。  据昆仑万维介绍,天工大模型4.0 4o版(Skywork 4o)以及Skyo由公司技术团队自主研发,充分利用公司在AI大模型、AI音乐、AI搜索中的研发经验,为用户

  • 每10份音频就有8份被“胡编”?OpenAI语音转录工具被曝存重大缺陷

    财联社10月28日讯(编辑 潇湘)生成式人工智能领域的领军者OpenAI,曾吹嘘其人工智能转录工具Whisper具有接近 “人类水平的稳定性和准确性”。然而,随着该转录工具在各行各业被越来越多地普及使用,其问题似乎也正开始凸显——根据业内媒体对十多位软件工程师、开发人员和学术研究人员的采访,如今Wh

  • 实时语音通讯技术:多人通话和语音识别

    神经网络实时语音通讯技术是一种基于网络传输的语音通讯技术,可以实现语音通话、语音聊天、语音会议等功能。随着互联网的发展,实时语音通讯技术越来越受到人们的多人通话多人通话是实时语音通讯技术中的一个重要应用场景,它可以实现多人语音聊天、语音会议等功能。多人通话需要解决的一个重要问题是音频同步,即如何保证

  • 白菜价AI语音转录,“美国科大讯飞”3年融资1.5亿美元

    Assembly AI由Dylan Fox在2017年底创立,致力于研究、训练和部署领先的语音AI模型,供开发人员和产品团队集成到他们的应用程序和服务中。与国内的“讯飞听见”类似,执行语音转录、内容审核、关键提取等任务。

  • AI日报:广电总局整治AI“魔改”视频乱象;HailuoAI上线AI语音克隆功能;OpenAI将发布全新Sora

    1、广电总局发布“管理提示”整治AI“魔改”现象,经典影视遭恶搞广电总局针对AI“魔改”视频现象发布管理提示,强调治理措施以保护经典文化。近期多部经典影视剧被恶搞改编,引发公众对传统文化的关注。管理要求各省局督促短视频平台清理相关内容,并落实生成式AI内容审核,以防止误导和侵权。【AiBase提要: