这里是AI贴吧网-AI资讯的硬核前线!我们24小时监测全球实验室动态,算法追踪巨头动向、代码解析学术突破,用最“硅基”视角解秘AI革命浪潮!
清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军3月29日发布了高可控视频大模型ViduQ1,官方宣称其为业内首个高可控AI视频大模型。
1AI从官方获悉,ViduQ1在多主体细节可控(特别是动作、布局可控)、音效同步可控、画质增强等方面均取得显著成效。以多主体细节可控为例,在语义指令的基础上,通过融入参考图的视觉指令,ViduQ1支持对场景中多主体的位置、大小、运动轨迹等属性进行更进一步的可控,对所有动作行为(出场、退场、坐立姿态、行动路线)进行精准调整。
其支持音效同步可控功能,可确保随着视频环境与画面转场,ViduQ1能够输出生成相应音效,并可精准控制每段音效的长短区间,精准设置每段音频出现的时间点,如0-2s风声、3-5s雨声等。
想掌握最新AI隐藏技能?挖透巨头紧急下架产品的真相?点击【AI贴吧网-AI资讯】,深度解析+实战案例,智能刷新你的认知!