亚马逊推出 Nova Act:可操控网页浏览器的 AI智能体

这里是AI贴吧网-AI资讯的硬核前线!我们24小时监测全球实验室动态,算法追踪巨头动向、代码解析学术突破,用最“硅基”视角解秘AI革命浪潮!

亚马逊于当地时间周一正式发布了其通用人工智能智能体(AIagent)——NovaAct。该智能体具备操控网络浏览器并自主执行简单网络任务的能力。与此同时,亚马逊还推出了配套的NovaAct软件开发工具包(SDK),旨在帮助开发者利用NovaAct构建智能体应用原型。

据1AI了解,NovaAct由亚马逊新近在旧金山成立的AGI(通用人工智能)实验室研发,该技术未来也将为备受期待的生成式AI增强版语音助手Alexa+提供关键功能支持。不过,亚马逊方面表示,今日起开放的版本为“研究预览版”,功能尚待完善。

开发者可以通过新设立的专属网站 nova.amazon.com 获取NovaAct工具包,该网站同时也是亚马逊展示其旗下各类Nova基础模型的平台。

NovaAct的推出标志着亚马逊正式加入AI智能体技术的竞争行列,意在凭借自研的通用AI智能体技术,与OpenAI的Operator和Anthropic的ComputerUse等产品展开竞争。当前,多家领先科技公司普遍认为,能够代替用户浏览网页、执行任务的AI智能体将极大提升现有AI聊天机器人的实用性。尽管亚马逊并非首家开发此类技术的公司,但凭借其庞大的Alexa用户基础,NovaAct未来可能拥有最广泛的应用潜力。

亚马逊介绍称,开发者使用NovaActSDK,将能够为用户自动化处理一些基础性网络操作,例如从餐饮品牌Sweetgreen订购沙拉或是在线上预订餐厅晚餐。该工具包提供了一系列工具,使AI智能体能够浏览网页、填写表单、在日历上选择日期等。

在性能方面,亚马逊声称,在公司内部的多项测试中,NovaAct的表现优于来自OpenAI和Anthropic的同类智能体。以衡量AI智能体与屏幕文本交互能力的ScreenSpotWebText测试为例,NovaAct得分高达94%,超过了OpenAI的CUA(88%)和Anthropic的Claude3.7Sonnet(90%)。然而值得注意的是,亚马逊并未公布NovaAct在如WebVoyager等行业更常用的智能体评估基准上的测试结果。

NovaAct是亚马逊上述AGI实验室对外发布的首个公开产品。该实验室由前OpenAI研究员DavidLuan和PieterAbbeel共同领导。这两位专家在去年被亚马逊聘用以主导其AI智能体研发工作之前,分别创立了AI初创公司Adept和Covariant。

对于一个以AGI为目标的实验室为何会开发订购沙拉的AI智能体,Luan在接受小编采访时解释道,他将智能体视为构建超智能AI系统的关键一步。他将AGI定义为“一个能够帮助你在计算机上完成人类所能做的任何事情的AI系统”。Luan还表示,其团队设计的NovaActSDK旨在可靠地自动化执行简短、简单的任务,并为开发者提供了精确定义何时需要人类介入智能体工作流程的工具。他希望借此帮助开发者创建更可靠的智能体应用,即使这些应用不一定是完全自主运行的。

目前,来自OpenAI、谷歌和Anthropic等公司的早期AI智能体普遍面临跨不同领域应用时可靠性不足的重大挑战。根据小编等媒体的测试,这些系统往往运行缓慢,难以长时间独立工作,且容易犯下人类通常不会犯的错误。亚马逊是否已经找到了克服这些难题的有效方法,还是其NovaAct智能体也将受困于同样的缺陷,市场将拭目以待。

想掌握最新AI隐藏技能?挖透巨头紧急下架产品的真相?点击【AI贴吧网-AI资讯】,深度解析+实战案例,智能刷新你的认知!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注