Anthropic 最近推出了一项创新功能,称为电脑使用,集成到其 Claude 3.5 Sonnet 模型中。这种功能允许人工智能以类似于人类用户的方式与计算机交互,使其能够执行诸如移动光标、打开浏览器和执行代码等任务。这一发展标志着人工智能功能的重大飞跃,特别是对于开发人员和程序员而言。
了解计算机的使用
它是如何运作的
计算机使用功能通过专用 API 运行,开发人员可以利用该 API 使 Claude 能够在计算机上执行各种任务。以下是其运作方式的详细说明:
- 用户提示:开发人员通过提示为 Claude 提供特定任务,例如“将猫的图片保存到我的桌面”。
- 工具激活:Claude 评估是否可以使用预定义工具协助满足请求。
- 执行:一旦识别出必要的操作,Claude 就会构建一个在受控环境(如虚拟机)中执行的工具使用请求。
- 任务完成情况:Claude 继续与计算机交互,直到任务完成,并将结果返回给用户。
主要特点
- 协调支持:突出的功能之一是它能够理解和操作屏幕坐标。这使得克劳德能够为光标移动提供精确的指令,这以前是人工智能模型的限制。
- 一般计算机技能:与之前仅限于特定任务的型号不同,Claude 旨在处理广泛的软件应用程序,使其能够满足各种自动化需求。
应用和优点
开发人员自动化
此功能的主要受众是开发人员,他们可以利用它来:
- 自动化重复性任务:需要多个步骤的任务可以自动化,从而显着减少时间和精力。
- 构建和测试软件:开发人员可以指示 Claude 浏览软件界面、执行测试,甚至调试代码。
- 进行研究:人工智能可以通过浏览网页并根据用户数据填写表格来协助收集信息。
现实世界的用例
几家公司已经在探索这种功能:
- 雷普利特正在将 Claude 的计算机使用功能集成到其平台中,以增强应用程序评估流程。
- Canva 和 DoorDash 等其他组织正在尝试自动化涉及众多步骤的复杂工作流程。
安全考虑
虽然这项技术潜力巨大,但 Anthropic 也承认相关风险。该公司强调针对潜在滥用的安全措施,例如恶意命令可能覆盖用户指令的即时注入攻击。当技术成熟时,鼓励开发人员从低风险任务开始。
Anthropic 的计算机使用功能代表了人工智能功能的突破性进步,允许与计算机进行更像人类的交互。随着这项技术的发展,它不仅有望提高开发人员的生产力,而且还将改变我们在各个行业实现自动化的方式。根据早期采用者的持续反馈,我们可以期待其功能和安全措施的快速改进。