OpenAI CEO山姆·奥特曼近日发布了一款名为“Operator”的云端浏览器AI代理。该代理旨在通过自然语言处理技术,帮助用户更高效地完成浏览网页、搜索信息、管理任务等操作。Operator能够理解用户的指令,自动执行复杂的多步骤任务,例如预订餐厅、查找航班信息或整理电子邮件。奥特曼表示,Operator的目标是让AI成为用户的“个人助手”,减少日常工作中的重复性劳动,提升生产力。这款AI代理的发布标志着OpenAI在将大型语言模型应用于实际场景的又一重要进展,展示了AI技术在生活和工作中的广泛应用潜力。
2025年1月24日,OpenAI CEO Sam Altman通过在线发布会正式推出了全新AI系统——Operator,此次发布会详细展示了Operator的功能、技术原理、应用场景及未来规划。
**Operator的功能与特点
Operator是一款基于网页浏览器的AI系统,能够独立完成用户分配的任务,例如网上订餐、购物、订票等,它通过控制云端浏览器中的鼠标和键盘来操作网页,无需用户手动干预。
**技术原理
Operator的核心技术结合了类似ChatGPT的AI模型和CUA(Computer Use Agent)技术,CUA技术使得Operator能够直接解读网页像素,无需依赖网站API即可与网页交互,这一特性使其能够处理更多未提供API的网站,扩展了应用范围。
**用户交互体验
Operator的界面设计简洁直观,用户只需输入提示即可启动任务,在执行操作前,Operator会进行确认,以确保用户意图得到正确执行,用户还可以随时“接管”控制权,进行手动操作或提供更多信息。
**应用场景演示
在发布会中,Operator成功完成了多项任务演示,包括通过OpenTable订餐、Instacart购物、StubHub订票、DoorDash订餐以及寻找清洁工等,这些演示展示了Operator在实际生活中的强大实用性。
**安全措施
为确保系统安全,Operator设计了多层防护机制,包括拒绝有害任务、模型审核、事后检测、网站屏蔽以及“提示注入监视器”等,这些措施旨在防止恶意使用,确保系统安全可靠地运行。
**当前状态与未来规划
Operator处于早期研究预览阶段,首先面向美国专业用户开放,未来将逐步向其他国家和Plus用户开放,OpenAI团队表示将持续改进Operator,使其功能更完善、成本更低廉、应用更广泛,Operator的API预计将在几周后推出。
**性能评估
在OSworld和WebArena两个基准测试中,Operator的表现优于其他公开发布的同类系统,但仍与人类水平存在一定差距,OpenAI表示,未来将通过技术优化进一步提升Operator的性能。
**发布会亮点回顾
在发布会中,Sam Altman与团队成员Yash、Ray、Casey共同演示了Operator的实际操作过程,Yash通过Operator完成了多项任务,包括预订餐厅、购买杂货、订票等,展示了Operator的高效性和灵活性。
Operator的推出标志着AI技术在自动化任务处理领域迈出了重要一步,尽管仍处于早期阶段,但其潜力已初露锋芒,Operator有望成为用户日常生活中的得力助手,进一步推动AI技术的普及与应用。
整理自OpenAI发布会,原始内容参考:[YouTube视频链接](https://www.youtube.com/watch?v=CSE77wAdDLg)。
网友评论