AI资讯

生数科技发布高可控视频大模型 Vidu Q1：可精准调整所有动作行为

aitieba

8 5 月, 2025

这里是AI贴吧网-AI资讯的硬核前线！我们24小时监测全球实验室动态，算法追踪巨头动向、代码解析学术突破，用最“硅基”视角解秘AI革命浪潮！

清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军3月29日发布了高可控视频大模型ViduQ1，官方宣称其为业内首个高可控AI视频大模型。

1AI从官方获悉，ViduQ1在多主体细节可控（特别是动作、布局可控）、音效同步可控、画质增强等方面均取得显著成效。以多主体细节可控为例，在语义指令的基础上，通过融入参考图的视觉指令，ViduQ1支持对场景中多主体的位置、大小、运动轨迹等属性进行更进一步的可控，对所有动作行为（出场、退场、坐立姿态、行动路线）进行精准调整。

其支持音效同步可控功能，可确保随着视频环境与画面转场，ViduQ1能够输出生成相应音效，并可精准控制每段音效的长短区间，精准设置每段音频出现的时间点，如0-2s风声、3-5s雨声等。

想掌握最新AI隐藏技能？挖透巨头紧急下架产品的真相？点击【AI贴吧网-AI资讯】，深度解析+实战案例，智能刷新你的认知！

发表回复取消回复