国内外 AI 大模型密集上新,行业或诞生新一线梯队

aixo 2024-09-25 04:31:28
大模型 2024-09-25 04:31:28

近期,国内外多家AI大模型密集“上新”。国内AI视频生成激战正酣,也有玩家悄悄抢占3D大模型赛道,则卷向了复杂推理。分析人士认为,这一轮技术迭代,或将使AI行业诞生新的一线梯队。

近期AI圈最受瞩目的产品,莫过于的“o1”大模型。9月13日,正式发布新一代大模型“o1”,即之前所传的“草莓”模型。据介绍,“o1”大模型具备更强大的推理能力,能够解决多步骤问题,在复杂的科学、数学和编程任务方面,“能够像人类一样思考”。

回到国内,角逐最激烈的,当属视频生成赛道。今年2月,发布视频大模型Sora,开启了AI视频的新时代。此后半年,国内大厂纷纷布局,国产AI视频大模型密集诞生。

6月,对标Sora,快手发布视频生成大模型“可灵”,支持通过文生视频、图生视频、视频续写功能,生成最长2分钟、30fps的1080p高分辨率视频。就在“可灵”上线一周后,Luma AI 发布文生视频模型 Dream ,每 120 秒能生成 120 帧画面,还能快速生成 5 秒钟的电影级别视觉效果视频片段。

9月,互联网大厂的AI视频之战再次掀起新高潮。

9月19日,阿里宣布通义万相视频生成功能上线。据报道,通义万相视觉模型支持最长5秒、每秒30帧、分辨率为720P的视频生成,并生成与画面匹配的音效,目前已开放文生视频、图生视频两个创作入口。

9月23日,美图公司公布旗下美图奇想大模型()视频生成能力全面升级。据介绍,美图奇想大模型目前单次文生视频与图生视频时长均可达5秒,最长支持1分钟生成时长、帧率24FPS的超长视频,分辨率高达1080P,同时支持任意视频尺寸输出。值得一提的是,基于美图在影像领域的深厚积累,结合对特征的大范围提取,其实现了在艺术风格、细腻画风与细节把控间的高度平衡,不同画风自由切换。

爱思助手_AI_ai写作

此前,美图奇想大模型已全面应用于旗下影像与设计产品,其视频能力,则率先落地美图旗下AI短片创作工具MOKI,让用户能够通过最低的门槛感受到AI为视频创作带来的改变。

字节跳动的豆包大模型,也将于9月24日发布视频生成模型。此前,字节跳动旗下的剪映团队已上线“即梦AI”,其核心功能包括图片生成、智能画布、视频生成以及故事创作等。

除了视频模型,AI玩家也开始抢占3D大模型赛道。国内3D大模型头部玩家VAST近日更新旗下大模型Tripo,支持文生3D、单图生3D。腾讯也推出了专门生成开放世界视频游戏的模型-O,能模拟游戏引擎功能,生成游戏角色、动态环境、复杂动作等等。

在大模型行业分析人士看来,此次各家大模型视频生成能力的集中升级,意味着国内AI行业正在进行新一轮洗牌,并将诞生一批新的头部玩家。而当下AI行业已进入商业化竞争的关键阶段,大模型如何落地到应用中,真正做出符合用户需求的产品,才是检验AI厂商实力的关键。

AI