谷歌计划融合 Gemini 与 Veo 模型，打造全能 AI助手

这里是AI贴吧网-AI资讯的硬核前线！我们24小时监测全球实验室动态，算法追踪巨头动向、代码解析学术突破，用最“硅基”视角解秘AI革命浪潮！

谷歌DeepMind首席执行官DemisHassabis在由领英联合创始人ReidHoffman共同主持的播客节目Possible中透露，谷歌计划将旗下的GeminiAI模型与Veo视频生成模型进行融合，以此提升Gemini对物理世界的理解能力。

Hassabis表示：“我们从一开始就将Gemini这一基础模型打造为多模态模型，因为我们有着构建一个通用数字助手的愿景，这个助手能够在现实世界中真正为你提供帮助。”

目前，整个AI行业正逐渐朝着“全能”模型的方向发展，这些模型能够理解和整合多种媒体形式。谷歌最新的Gemini模型不仅可以生成图像和文本，还能生成音频；而OpenAI在ChatGPT中的默认模型如今也能创建图像，包括宫崎骏风格的艺术作品。亚马逊也宣布计划在今年晚些时候推出一款“任意到任意”的模型。

据1AI了解，这些“全能”模型需要大量的训练数据，包括图像、视频、音频、文本等。Hassabis暗示，Veo的视频数据主要来源于谷歌旗下的YouTube平台。他说道：“通过观看大量的YouTube视频，Veo2能够了解世界的物理规律。”此前，谷歌曾向小编表示，其模型可能会根据与YouTube创作者达成的协议，使用“部分”YouTube内容进行训练。据报道，该公司去年扩大了服务条款的部分内容，以便获取更多数据来训练其AI模型。

想掌握最新AI隐藏技能？挖透巨头紧急下架产品的真相？点击【AI贴吧网-AI资讯】，深度解析+实战案例，智能刷新你的认知！

ai财泰

谷歌计划融合 Gemini 与 Veo 模型，打造全能 AI助手

发表回复取消回复

发表回复 取消回复

发表回复取消回复