首页 > AI资讯 > 行业动态 > Apple GPT投资开发中,腾讯推出超千亿参数的混元大模型,马斯克计划组建大型AI公司|36氪GPT周报

Apple GPT投资开发中,腾讯推出超千亿参数的混元大模型,马斯克计划组建大型AI公司|36氪GPT周报

新火种    2023-09-14

微软申请AI智能背包专利

9月4日消息,微软申请了一款AI智能背包专利,这款背包包括摄像头、麦克风、扬声器、网络接口、处理器和存储器,能够识别环境中的物体,执行上下文相关的任务,从云端获取信息,并与其他设备互动。例如,背包可以自动扫描周围环境并告诉你是否可以朝某个方向滑雪,或者在你站在音乐会海报前时,可以自动将该活动添加到你的日历中。整个过程分为六个步骤:接收命令、感知环境、发送信息到AI引擎、通过语音识别和自然语言处理解释信息,最后返回响应。

https://www.chinaz.com/2023/0904/1556313.shtml

LLaMA 2训练速度提升近200%

9月4日,Golossal-AI通过提供8到512卡LLaMA2训练、微调、推理方案,使其700亿参数LLaMA2模型的训练时间缩短了195%。对LLaMA系列类具有优秀基础语言能力的大模型进行预训练的计算成本极高。Colossal-AI通过系统和算法优化,使LLaMA2在8-512个GPU之间保持良好的可扩展性和性能。此外,Cossoal-AI还提供了云平台和一站式解决方案,无需编写代码,开发者可以直接上传数据进行模型训练和部署。

https://cloud.tencent.com/developer/article/2325041

高通布局AIGC和汽车领域

9月5日消息,由于全球最大芯片公司的头衔英伟达抢走,以及与苹果公司合作的不确定性,如今高通也开始发力生成式人工智能技术,并布局多元化战略。到目前为止,大语言模型一直依赖于云上的海量数据来生成文本和图像。但高通 CEO 阿蒙(Cristiano Amon)认为,生成式人工智能在云外的需求也会很大。近日,高通宣布推出新的车载生成式人工智能功能,并与亚马逊云服务 AWS 建立了新的合作伙伴关系。高通希望利用生成式人工智能的热潮,说服汽车制造商购买更多的芯片,并围绕它们构建新场景。例如,智能助手可以帮助驾驶员在城市中导航、预订和完成其他日常计算任务。

https://www.ithome.com/0/717/182.htm

昆仑万维“天工大模型”登顶多模态榜单,可解决幻觉、跨语言难题

9月5日消息,昆仑万维“天工”大模型 Skywork-MM 登顶多模态榜单,在腾讯优图实验室联合厦门大学开展的多模态大语言模型(MLLM)测评中,综合得分排名第一。“天工”大模型 Skywork-MM主要从数据、模型和训练流程三方面入手,解决了现有多模态大模型中颇为困扰的两大问题:幻觉(大模型更倾向于给出肯定答复)和较弱的跨语言能力。

https://www.36kr.com/p/24057

360智脑大模型面向公众开放使用

9月5日消息,360智脑大模型即日起将面向公众开放,全面接入360“全家桶”。360智脑将在五大平台面向公众开放,用户可以通过360智脑官网、各大应用商店下载“360智脑”App。此外,官方还表示,用户也可以升级360安全卫士、360安全浏览器、360搜索至最新版本。

https://www.ithome.com/0/716/945.htm

科大讯飞宣布讯飞星火向全民开放

9月5日消息,科大讯飞现宣布,讯飞星火大模型正式面向全民开放,用户可以在各大应用商店下载直接注册使用。讯飞星火是科大讯飞推出的全新一代认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。讯飞星火 V2.0 基于 Python 和 C++ 进行代码写作的能力已高度逼近 ChatGPT,差距仅为1% 和 2%;到今年 10 月 24 日将实现通用模型对标 ChatGPT 3.5,中文能力超越、英文能力相当。

https://www.ithome.com/0/716/921.htm

Meta内部为争夺计算资源,超半数研究人员离职

9月6日,据The Information报道,Meta Platforms在开发大语言模型Llama过程中,内部两个团队因争夺计算资源产生内斗,半数以上的研究人员已离职。Meta的人工智能研究实验室面临大量员工流失的问题。公开资料显示,Llama论文的作者中,已经有一半离职加入其他公司或创业。参与Llama研究的员工抱怨团队获得的计算资源远少于Meta在北美的另一个团队。

https://www.ithome.com/0/717/272.htm

马斯克计划合并Neuralink、特斯拉组建大型AI公司

9月6日消息,马斯克计划将特斯拉、SpaceX、Neuralink和最近创立的xAI公司整合成一家新的人工智能公司。通过结合推特的用户数据和特斯拉自动驾驶系统收集的真实世界图像,创建聊天机器人和实体机器人,从而打造通用人工智能。推特拥有庞大的用户数据集,而特斯拉每天收集大约1600亿个摄像头图侦,这些都是训练人工智能系统的宝贵资源。推特和特斯拉尚未就此事发表评论。

https://www.qbitai.com/2023/09/82188.html

微软宣布将扩大和阿联酋 G42 集团的合作

9月6日下午消息,微软宣布将扩大和阿联酋阿布扎比的人工智能及云计算厂商“G42 集团”的合作伙伴关系,双方将在多个领域开发人工智能技术,同时在阿联酋提供云计算基础设施服务。通过这一合作,微软云计算服务 Azure 和人工智能业务将进入阿联酋,提供给该国的政府机构和各行业公司使用,与此同时,也能够帮助当地客户满足阿联酋政府监管和隐私信息保护要求。

https://www.ithome.com/0/717/327.htm

Zoom正式发布类ChatGPT产品—AI Companion

9月6日,全球视频会议领导者Zoom在官网宣布,正式发布生成式AI助手——AI Companion。AI Companion提供了与ChatGPT类似的功能,包括根据文本对话起草各种内容,自动生成会议摘要,自动回答会议相关问题等,以帮助工作人员节省时间提升工作效率。据悉,AI Companion由OpenAI的GPT系列、Anthropic和Meta的Llama 2多种大语言模型混合打造而成。如此,AI Companion可以根据不同的业务需求,启动功能对应的模型实现最佳的动态效果。

https://www.chinaz.com/2023/0906/1556791.shtml

中国电信、华为、百度、字节跳动等 30 余机构共同发起 AI 安全工作组

9月7日,于2023 inclusion・外滩大会举行的《探索下一代安全智能》论坛上,世界权威国际产业组织“云安全联盟”(CSA)大中华区宣布成立“AI 安全工作组”。中国电信、蚂蚁集团、华为、百度、字节跳动、西安电子科技大学、国家金融测评中心等 30 余家机构成为首批发起单位,工作组组长由中国电信股份有限公司研究院安全技术研究所副总工程师、数据和 AI 专业方向负责人黄磊担任。该工作组的主要职责是研究和编制与 AI 安全相关的技术安全威胁和风险、AI 数据安全与隐私保护、AI 技术助力安全应用、AI 的伦理和 AI 合规等方面的材料,将围绕以 AI 安全为核心的各种 AI 技术威胁、风险、防护以及其他相关问题展开研究工作。

https://www.ithome.com/0/717/610.htm

Anthropic 推出付费订阅计划 Claude Pro,与 ChatGPT Plus 竞争

9月7日,人工智能制造商和OpenAI竞争对手Anthropic推出了Claude Pro,其基于网络的 Claude.aiAI助手的订阅版本,功能类似于ChatGPT。Claude Pro在美国的价格为每月20美元,在英国的价格为18英镑/月。其最大亮点主要是在对话数量上,比免费版多了5倍使用量。

https://www.chinaz.com/2023/0908/1557489.shtml

DeepMind提出OPRO方法,指导大模型进行优化

9月7日,DeepMind团队发表论文《Large Language Models as Optimizers》,提出了一种名为OPRO(Optimization by PROmpting)的方法,用自然语言描述优化问题,指示语言模型基于之前找到的解进行迭代生成新的解。这种方法的优势在于可以通过改变问题描述使大模型能够灵活快速得应用于各种场景。

https://www.jiqizhixin.com/articles/2023-09-09

摩根士丹利与OpenAI合作推出AI聊天机器人,可提供投资见解

9月7日消息,摩根士丹利将于本月末时候推出生成式人工智能(AI)聊天机器人,已与由1000名财务顾问测试数月。这款人工智能聊天机器人由摩根士丹利和 ChatGPT 开发商 OpenAI 共同研发。在客户的许可下,人工智能聊天机器人最终将能够创建对话的会议摘要,起草建议下一步行动的后续电子邮件,更新银行的销售数据库,安排后续约会,并学习如何帮助顾问管理客户的财务,包括税收、退休储蓄和遗产等。与此同时,银行家们可以使用人工智能聊天机器人快速找到研究报告或表格,而无需再筛选数十万份文件。

https://www.ithome.com/0/717/644.htm

OpenAI 首届开发者大会「OpenAI DevDay」定档,无大模型发布,有新成果公布

OpenAI 官宣其首届开发者大会「OpenAI DevDay」,定于当地时间11月6日召开,地点设在旧金山。届时,来自全球各地的数百名开发者将与 OpenAI 团队成员聚在一起,预览新的工具并交流想法。OpenAI 首席执行官 Sam Altman 表示此次大会并不会发布 GPT-5或GPT-4.5或类似的大模型,但发布的最新成果仍会激动人心。

https://www.jiqizhixin.com/articles/2023-09-07-3

百川智能发布Baichuan2大模型,性能超越LLaMA2

9月6日,百川智能召开主题为“百川汇海,开源共赢”的大模型发布会。会上,百川智能宣布正式开源微调后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat与其4bit量化版本,并且均为免费可商用。这些模型在多项能力上有显著提升,包括数学、代码生成、安全、逻辑推理和语义理解等方面。特别是,Baichuan2-7B模型在英文基准测试中与拥有130亿参数的Llama2模型持平,显示出其高效的性能。

https://www.sohu.com/a/718434882_100106801

迄今最大参数规模Falcon模型现身,在Hugging Face排行榜中击败Llama2

9月7日消息,近日,阿布扎比的全球领先技术研究中心 TII 发布了一款世界顶级开源大模型 ——Falcon180B。这款模型在3.5万亿 token 的训练下,拥有1800亿参数,性能超过了之前的开源模型 Llama2,甚至接近了谷歌的 GPT-4。Falcon180B 在各项任务中表现出色,被认为是目前最好的开源大模型之一。Falcon180B 的训练过程使用了亚马逊云机器学习平台,并在多达4096个 GPU 上完成了训练,总共进行了大约7,000,000个 GPU 计算时。训练数据主要来自于 RefinedWe 数据集,其中包括对话、技术论文和一小部分代码等多种数据。

https://www.chinaz.com/2023/0908/1557455.shtml

百度营销发布 AI Native 营销平台“轻舸”

9月7日,百度营销发布全球首个 AI Native 营销平台“轻舸”,通过生成式 AI 贯通营销方案表达和广告投放优化,预期可以将广告投放转化率提升超20%。轻舸可以实现“自由表达”。通过自然语言交流,轻舸可以用一个 Prompt 提示词直接传达需求,“无衰减”传达企业营销策略,让商家的优质信息和服务直接连接到所需的目标人群。

https://www.chinaz.com/20

腾讯混元大模型正式亮相,参数规模超千亿

在9月7日举办的2023腾讯全球数字生态大会上,腾讯正式发布混元大模型。据介绍,混元大模型参数规模超千亿,预训练语料超 2 万亿 tokens,腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、

https://www.tencent.com/zh-cn/articles/2201685.html

腾讯云AI绘画产品发布,支持超25种生成风格

在9月7日的2023腾讯全球数字生态大会上,腾讯云正式推出全新的AI绘画产品,它依托腾讯自研的AI绘画模型,提供AI图像生成与编辑技术API服务,使用户能够轻松地根据输入的文本或图片,智能创作出与输入相关的图像内容。腾讯云AI绘画具有强大的中文理解能力,可以更好地支持中文元素的图像生成,例如古诗词理解、水墨剪纸等,目前已开放超过25种生成风格。

https://www.chinaz.com/2023/0909/1557842.shtml

腾讯健康公布医疗大模型,基于混元大模型微调打造

9月8日,腾讯健康公布医疗大模型,全新发布智能问答、家庭医生助手、数智医疗影像平台等多场景AI产品矩阵,药物发现平台“云深”(iDrug)披露全新的蛋白质结构预测算法框架tFold。腾讯健康医疗大模型基于混元大模型,经过3000万覆盖患者、医生、药厂等场景及医疗流程的问答对话进行多任务微调,以及36万组专家医生标注数据的强化学习。

https://www.chinaz.com/2023/0910/1557973.shtml

苹果大力投资开发Apple GPT,目标在明年发布的iPhone中接入

9月8日消息,据The Information报道,苹果公司正在大力投资开发其大语言模型Apple GPT,目标是将其整合到明年发布的iPhone中。苹果不仅增加了研究预算,每天投入数百万美元,还从谷歌挖来了多名工程师。据悉,目前苹果的AI团队已经训练出了超越GPT-3.5的模型,预计将大幅升级Siri和其他产品功能。

https://www.36kr.com/p/24226

蚂蚁集团正式发布金融大模型AntFinGLM

9月8日,蚂蚁集团在外滩大会上正式发布工业级金融大模型(AntFinGLM) ,同时开放了金融专属任务评测集「Fin-Eval」。该测试集从五大维度(认知、生成、专业知识、专业逻辑、安全性)28类金融专属任务评估了金融大模型能力,结果大幅超过当前主流通用大模型。在「研判观点提取」、「金融意图理解」、「金融事件推理」任务上,金融大模型已经达到专家平均水平。

https://www.chinaz.com/2023/0910/1557970.shtml

针对AI的编程语言“Mojo” 开放下载,比 Python 快 68000 倍

9月8日,Modular AI 公司宣布Mojo 现已开放本地下载运行。Mojo 是 Modular AI 公司开发的一种用于计算的高性能“Python++”编程语言,面向 AI 开发人员推出,随着时间的推移,它将发展成为 Python 的超集,号称比 Python 快 68000 倍。目前,Mojo 已经支持与任意 Python 代码无缝集成,并具有可扩展的编程模型来针对性能关键型系统,包括人工智能中普遍存在的加速器(例如 GPU)。

https://www.ithome.com/0/717/835.htm

英伟达发布深度优化开源库TensorRT-LLM,使H100推理性能最高提升 8 倍

9月9日消息,英伟达今天宣布推出名为 TensorRT-LLM,是一个深度优化的开源库,能够在 Hopper 等 AI GPU 上加速所有大语言模型的推理性能。英伟达目前已经和开源社区合作,利用 SmoothQuant、FlashAttention 和 fMHA 等尖端技术,实现 AI 内核来优化其 GPU,可以加速 GPT-3(175 B),Llama、Falcom(180 B)和 Bloom 模型。

https://www.ithome.com/0/718/007.htm

罗切斯特大学研究人员开发出可远程评估帕金森病症的AI工具

9月10日消息,罗切斯特大学的研究人员开发出一种人工智能工具,可以根据 MDS-UPDRS 指南提供快速评估,自动生成可解释、标准化、可重复、与医学指南一致的计算指标,帮助帕金森病患者在几分钟内远程评估自己的症状严重程度。工具在由250 名全球帕金森病患者参与测试的结果显示,专业神经科医生的表现略好于人工智能模型,但人工智能模型优于具有 UPDRS 认证的初级保健医生。

https://www.ithome.com/0/718/166.htm

Adobe正式推出企业版Firefly,并向企业提供侵权包赔服务

9月10日消息,Adobe数字媒体副总裁在Summit活动中表示,正式为企业用户推出扩展版Firefly,并专门成立法律基金,提供“对生成内容侵权诉讼的全面补偿”服务,目的就是为了让企业客户可以放心在公司业务部署生成式AI工具。官方自述,公司模型数据主要来源Adobe已有版权的库存图片、公开授权的内容,在合规性和知识产权保护方面已有保障。

https://www.ithome.com/0/718/125.htm

Meta 计划明年初开发全新大语言模型,称比肩 GPT-4

9月11日消息,据《华尔街日报》报道,Meta 一直在抢购人工智能训练芯片 Nvidia H100 并建立数据中心,计划在2024年初开发新的人工智能系统(即大型语言模型),其功能将与OpenAI的GPT-4一样强大。该模型的功能将比Llama 2的商业版本强大数倍。计划中该模型(细节可能发生变化)将帮助其他公司建立产生复杂文本、分析和其他输出的服务。

https://www.ithome.com/0/718/217.htm

相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

热门文章