生数科技视频大模型 Vidu 正式开放 API，接入百度智能云千帆平台

aixo 2024-09-26 08:06:01

2024-09-26 08:06:01

每经记者可杨每经编辑梁枭

9月25日，生数科技联合创始人兼CEO唐家渝在百度云智大会上宣布，生数科技旗下视频大模型Vidu正式开放API（应用程序编程接口），并同步接入百度智能云千帆大模型平台，成为平台接入的首个视频大模型。

生数科技作为国内最早布局多模态通用大模型的团队之一，今年4月联合清华大学发布了视频大模型Vidu。

6月，生数科技完成数亿元Pre-A轮融资，由百度、北京市人工智能产业投资基金领投，中关村科学城公司、启明创投等跟投。彼时，生数科技方面曾表示，将基于百度百舸·AI异构算力平台持续训练、提升模型能力，并逐步通过百度智能云千帆平台开放模型服务。

据唐家渝介绍，Vidu采用的架构是团队纯自研的U-ViT架构，是全球最早提出的融合架构，早于Sora的DiT架构，这为通用生成任务奠定了重要基础。

生数科技联合创始人兼CEO唐家渝图片来源：企业供图

他同时表示，Vidu模型具备文生视频和图生视频能力，同时支持中英文指令输入；在时长方面，Vidu在模型层面最长可支持一键32s视频的生成；画面质感方面，Vidu最高可输出1080p分辨率。

生数科技方面表示，目前，影视、动画、广告等行业的企业机构普遍存在规模化视频产出需求，Vidu API的开放，将助力这些企业在视频生产环节降本增效，并激发创意。同时对于众多开发者而言，Vidu API的开放也为探索AI 2.0应用提供了重要基础。

生数科技认为，视频大模型高度个性化、自动化的内容创作能力，将赋予企业在营销、品牌推广和内容创新等场景中的全新竞争力，视频模型的引入将成为创意产业提升竞争力的关键因素。基于此背景，开放Vidu API成为生数科技进一步推进商业化布局的重要战略举措。

2024年以来，视频大模型的竞争日趋激烈，9月24日，字节跳动刚刚宣布发布了豆包视频生成-、豆包视频生成-两款大模型。在此之前，行业内已有快手的视频生成大模型“可灵”；同时，阿里旗下的通义万相在9月宣布全面升级，并发布全新视频生成模型；图像赛道的老玩家美图秀秀同样在9月宣布旗下的美图奇想大模型（）视频生成能力全面升级。

大模型

生数科技视频大模型 Vidu 正式开放 API，接入百度智能云千帆平台

腾讯设计杰出专家:大模型加速产业进入全新智能时代

涉及量子计算！美国将中国科大、中国科学院物理所等37个实体列入“实体清单”｜硅基世界

站长之家：正筹备展示革命性的人机对话技术

AI搜索的战场，我们为什么要在意的？

联合创始人Mike被任命为首席产品官

微软 Phi-3-vision 基准测试,主打“视觉能力”

中国品牌人物500强前十回应：别在意低头做事

以专业知识内容助力民众跨越自媒体运营门槛

Temu们狂卷低价，亚马逊也坐不住了

微信加大“自媒体”造谣治理力度：限制增粉、阶梯封号