Aaron Levie 把 computer use 和代码生成定位为 agent 的终极原语——这不是一个功能特性,而是定义了 agent 能做什么的基础层。如果你在做 agent 相关产品,这条分析直接影响架构决策。
计算机使用(computer use)和即时编写运行代码的能力,是 agent 在知识工作中承担越来越多任务的终极原语(primitives)。
大多数工作需要在多个应用之间跳转,在工作流中处理广泛的数据集。agent 需要能够穿越这些系统才能有效地自动化企业中的任何实际工作。
现在我们将拥有相当于拥有一个专家程序员(或任意数量的专家程序员)的 agent,可以编写代码或使用任何 API 来自动化你正在做的任何工作。Agent 将可以访问用户的计算机和资源,或者有自己的沙箱来操作,并能够组合完成任务所需的工具。
这开启了最广泛的 agent 用例集合。
当然,安全、权限和访问控制、身份挑战等方面会有各种障碍。例如:agent 应该始终代表用户行事,还是应该有自己的身份和有限的访问权限?当系统上的活动量不再是安全事件的可靠信号时,你如何分流安全事件?你如何确保 agent 没有失控或被 prompt 注入去做有风险的事?这些都是需要解决的问题。
此外,还需要大量工作来确保软件设置好,使 agent 能够以无头模式(headless)使用其工具进行操作。这对一些现有厂商来说将是不舒服的现实,但对于那些历来通过 API 无缝运作、并有商业模式支撑的工具来说,则是受欢迎的。
工作 agent 的世界即将发生大量变化,而且会变得相当疯狂。
Aaron Levie 认为 computer use 和即时编写代码是 agent 的两个终极原语——它们让 agent 能穿越多个应用系统自动化知识工作。这开启了最广泛的用例,但也带来安全、身份管理、prompt 注入等新挑战。现有软件需要为 agent 的无头操作模式做好准备。
Computer use 和代码生成的组合让 agent 能穿越任何应用系统、组合任何工具。这不是一个功能点,而是定义了 agent 能做什么的基础层。所有上层应用都将建立在这两个能力之上。
计算机使用和即时编写代码是 agent 的终极原语。
Agent 是否应有独立身份?系统活动量不再是安全信号时怎么办?Prompt 注入如何防御?这些是企业部署前的必答题。Levie 没有给出答案,但指出了这些问题的紧迫性。
agent 应该始终代表用户行事,还是应该有自己的身份和有限的访问权限?
Agent 需要以 headless 模式操作软件。传统 UI 导向的产品需要添加 API 层,对一些厂商是不舒服的转型。但对原生 API-first 的工具来说是利好,商业模式天然支持 agent 调用。
确保软件能让 agent 以无头模式操作是大量工作。这对一些厂商不舒服,但对 API-first 工具是利好。
计算机使用和即时编写代码是 agent 的终极原语。
相关知识页
工具链从 Demo 走向生产,编排与评估是主战场。
继续阅读
Zara Zhang 指出 Lark CLI 让 Claude Code/Codex 能访问和操作所有企业协作数据——聊天、日历、会议、文档、表格。企业协作平台对 agent 开放。
继续阅读
Ryo Lu 发出了一篇关于“软件灵魂”的长文:2005 年的 Mac 有质感、有哲学,而今天 A/B 测试和设计系统磨平了一切。AI agent 让生产速度指数级提升,但也让“能跑却无灵魂”的垃圾软件泛滥。他认为品味和执念无法被编程,AI 的真正价值是让有愿景的人做出以前做不到的东西——如果我们做对了,这将是一场文艺复兴,而非更快的工厂。
继续阅读
Aaron Levie 认为 agent 时代的最大机会不在写代码,而在重新设计企业工作流程。用 agent 自动化知识工作需要大量实际投入——整理数据、连接系统、改造流程、设计人机协作机制。编程之外的知识工作没有捷径,这恰恰创造了新的高价值岗位。
继续阅读
Peter Yang 看好 Granola(AI 会议笔记工具):会议记录是公司中最有用的上下文。
继续阅读
Peter Yang 分享了对 Cowork 设计负责人 Jenny 的采访收获:用 Cowork 自动产出周报、用笔记文件夹做记忆系统、Anthropic 极强的内部 dogfooding 文化、10 天发布背后有一年原型探索、设计师应向工程师学习 AI 采纳方式。