幻方-4o发布新一代旗舰生成模型-V2

aixo 2024-05-17 03:22:06

2024-05-17 03:22:06

近日，发布了新一代旗舰生成模型GPT-4o（“o”代表omni，即全能的意思）。据悉，GPT-4o为面向未来人机交互范式的全新大模型，具有文本、语音、图像三种模态的理解力，反应极快还带有感情，也“很通人性”。

开源证券研究报告介绍，GPT-4o有四大特点：一是多模态能力大幅提升，可以跨文本、音频和视频进行实时推理；二是更加“像人”；三是毫秒级响应，API（应用程序接口）成本更低；四是拥有3D视觉内容生产能力。

全球大模型竞争加剧

据悉，GPT-4o将免费提供给所有用户，还将推出桌面版，轻量化的使用体验可以融入任何工作流程中。

“GPT-4o作为一个具有多模态能力的生成型模型，将在客户服务、医疗保健、教育、娱乐、无障碍技术等诸多领域发挥重要作用，助力相关领域的AI应用‘更加好用，性价比更高’，更好地打开应用商业化空间，也会加剧全球各大模型厂商的竞争。”中国电子商务专家服务中心副主任郭涛在接受《证券日报》记者采访时表示。

近段时间，不少海内外行业巨头频频发布大模型最新成果。例如谷歌发布升级版的最强大AI模型迎战GPT-4o，谷歌CEO桑达尔·皮查伊表示：“谷歌所有的工作都围绕生成式AI模型来做，希望每个人都能从所做的事中受益。”

国内的知名私募巨头幻方量化旗下的AI公司（深度求索）发布全新第二代MoE（混合专家）大模型-V2，该模型拥有2360亿个参数，其中有210亿个活跃参数。

昆仑万维正式将天工大模型迭代至3.0版本，据悉“天工3.0”采用4000亿参数MoE架构，是目前全球模型参数最大、性能最强的开源MoE模型之一。“天工3.0”在语义理解、逻辑推理等方面能力实现质的飞跃，其技术知识能力较上一代模型提升20%，数学、代码等能力提升超30%。此外，百度、商汤科技等也发布了最新多模态模型成果。

“推出GPT-4o及近期海内外厂商频频发布大模型迭代升级成果，竞争焦点或集中在多模态能力、Agent（指能自主活动的软件或者硬件的智能体）能力和API调用成本优化等，均为大模型应用落地并商业化的关键因素。”开源证券分析师方光照认为。

多家公司跟进AI应用布局

多模态模型可以应用于各种终端设备，如智能手机、平板电脑、车载多媒体端口、智能音箱、机器人等。此外，还可以应用于企业级产品，如影视、教育、营销、搜索、办公等各个领域。

在此背景下，不少上市公司通过大模型加速推动在AI领域的业务布局与应用。5月15日，金蝶集团发布基于企业管理、AI、大模型三者叠加结合的金蝶，这款应用具备感知、记忆、思考、行动能力，助力管理者及员工轻松应对多项管理工作。

主营为营销传播智慧服务的因赛集团日前对外表示，公司自研的营销行业AIGC应用级模型，不断取得技术突破，“图生视频”“文生视频”等各项功能和产品发布始终走在行业前列。同时，公司会密切关注世界前沿的最新技术，持续对各项产品和功能进行优化与迭代，适时拓展新的产品方向，目前论证可行的产品方向包括但不限于3D视频与数字人。

奥飞娱乐在互动易平台上表示，目前其持有光年无限5%股权，光年无限有自己的AI对话机器人产品——图灵机器人开放平台，并上线AI对话小程序“喜羊羊与灰太狼+”，定位儿童用户，提供亲子陪伴体验。

字节跳动也最新发布了豆包大模型，据字节跳动旗下云服务平台火山引擎总裁谭待介绍：“经过一年时间的迭代和市场验证，豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一，目前日均处理1200亿文本，生成3000万张图片。大模型从以分计价到以厘计价，将助力企业以更低成本加速业务创新。”

“拥有多模态能力的大模型将为上市公司在客服服务、教育培训和终端应用等领域提供了广阔的应用前景。这种全新的交互模式将为企业带来更高的效率和更低的成本，同时为用户带来更便捷与愉悦的体验。”中国信息协会常务理事朱克力向记者表示。

GPT

幻方-4o发布新一代旗舰生成模型-V2

腾讯设计杰出专家:大模型加速产业进入全新智能时代

涉及量子计算！美国将中国科大、中国科学院物理所等37个实体列入“实体清单”｜硅基世界

站长之家：正筹备展示革命性的人机对话技术

AI搜索的战场，我们为什么要在意的？

联合创始人Mike被任命为首席产品官

微软 Phi-3-vision 基准测试,主打“视觉能力”

中国品牌人物500强前十回应：别在意低头做事

以专业知识内容助力民众跨越自媒体运营门槛

Temu们狂卷低价，亚马逊也坐不住了

微信加大“自媒体”造谣治理力度：限制增粉、阶梯封号