谷歌计划融合 Gemini 与 Veo 模型,打造全能 AI助手

这里是AI贴吧网-AI资讯的硬核前线!我们24小时监测全球实验室动态,算法追踪巨头动向、代码解析学术突破,用最“硅基”视角解秘AI革命浪潮!

谷歌DeepMind首席执行官DemisHassabis在由领英联合创始人ReidHoffman共同主持的播客节目Possible中透露,谷歌计划将旗下的GeminiAI模型与Veo视频生成模型进行融合,以此提升Gemini对物理世界的理解能力。

Hassabis表示:“我们从一开始就将Gemini这一基础模型打造为多模态模型,因为我们有着构建一个通用数字助手的愿景,这个助手能够在现实世界中真正为你提供帮助。”

目前,整个AI行业正逐渐朝着“全能”模型的方向发展,这些模型能够理解和整合多种媒体形式。谷歌最新的Gemini模型不仅可以生成图像和文本,还能生成音频;而OpenAI在ChatGPT中的默认模型如今也能创建图像,包括宫崎骏风格的艺术作品。亚马逊也宣布计划在今年晚些时候推出一款“任意到任意”的模型。

据1AI了解,这些“全能”模型需要大量的训练数据,包括图像、视频、音频、文本等。Hassabis暗示,Veo的视频数据主要来源于谷歌旗下的YouTube平台。他说道:“通过观看大量的YouTube视频,Veo2能够了解世界的物理规律。”此前,谷歌曾向小编表示,其模型可能会根据与YouTube创作者达成的协议,使用“部分”YouTube内容进行训练。据报道,该公司去年扩大了服务条款的部分内容,以便获取更多数据来训练其AI模型。

想掌握最新AI隐藏技能?挖透巨头紧急下架产品的真相?点击【AI贴吧网-AI资讯】,深度解析+实战案例,智能刷新你的认知!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注