智谱 AI 推出清影模型，让 C 端用户体验 AI 文生视频、图生视频能力

aixo 2024-07-27 13:49:55

2024-07-27 13:49:55

智谱AI持续努力打造对标世界先进水平的模型产品矩阵。

据IPO早知道消息，智谱AI CEO张鹏在7月26日举行的智谱 Open Day上宣布，AI生成视频模型清影（Ying）正式上线智谱清言，生成6秒视频只需要30秒的时间。即日起所有C端用户，都能通过清影（Ying）体验到AI文生视频、图生视频能力。

张鹏表示，这次生成式视频能力的全面上线，为的是让大家都能体验生成式视频功能，希望能够听到大家的意见和反馈。未来，智谱 AI 将采用快速迭代的方式，不断提升生成式视频模型能力。

当然，在生成式视频模型的研发中， Law 继续在算法和数据两方面发挥作用。“我们积极在模型层面探索更高效的方式。”张鹏表示：“随着算法、数据不断迭代，相信 Law将继续发挥强大威力。”

本次清影（Ying）底座的视频生成模型是，它能将文本、时间、空间三个维度融合起来，参考了Sora的算法设计，它也是一个DiT架构，通过优化，相比前代（）推理速度提升了6倍。理论上，模型侧生成6秒视频仅需30秒时间。

智谱自研了一个端到端视频理解模型，用于为海量的视频数据生成详细的、贴合内容的描述，这样可以增强模型的文本理解和指令遵循能力，使得生成的视频更符合用户的输入，能够理解超长复杂指令。

在内容连贯性上，智谱AI自研高效三维变分自编码器结构（3D VAE），将原视频空间压缩至2%大小，配合3D RoPE位置编码模块，更有利于在时间维度上捕捉帧间关系，建立起视频中的长程依赖。

模型亦同步上线智谱AI大模型开放平台，开发者可以通过调用API的方式，体验和使用文生视频以及图生视频的模型能力，在国内尚属首次。

人工智能行业对多模态模型的探索还处于初级的阶段，清影（Ying）还将不断迭代，智谱AI 将持续努力打造对标世界先进水平的模型产品矩阵，致力于通过大模型链接物理世界的亿级用户，为千行百业带来持续创新与变革，加速迈向通用人工智能时代。

海量资讯、精准解读，尽在新浪财经APP

智谱AI