k8凯发天生赢家

起源:乌克兰首都基辅陆续传出剧烈爆炸声作

起源:乌克兰首都基辅陆续传出剧烈爆炸声作者: 阮馨学:

Agent集体进化!腾讯谷歌们加码,AI打工人要遍及了 ?

最近我的 X 首页有点奇怪,关于 Agent 的帖子显著变多了,但和以前那种「某某模型评测」不一样,各人如同不再关切这个模型答题答得有多好,更在意一件更现实的事,哪个 Agent 能助我把手头这件事做完 ?

在刚刚实现的 5 月,「怪事」多了起来。5月20日,腾讯推出了接赘马维斯」(Marvis)的器材,官方定位是「操作系统层级 AI 副手」,Windows、macOS、安卓三端同步上线,内置 6 个 7×24 幼时在线的专项 Agent,每个掌管一块:文件、浏览器、利用、搜索、推算机操控,装机即用。第二天,OpenAI 在 5 月 21 日颁发 ChatGPT 以 add-in 大局接进 Microsoft PowerPoint,免用度户和 Business 订阅者都能用,在 PowerPoint 里开个侧边栏,用天然说话天生或批改 PPT。

而在统一周,Google 在 I/O 2026 上推出了 Gemini Spark,一个能够 24 幼时持续跑的幼我 Agent,运行在 Google Cloud 专属虚构机上,能读你的邮件、改你的文档、通过 Chrome 操作网页,你甚至不必要盯着它,这些活都能干完。

(图源:雷科技造图)

这就不难理解为何风向转得如此之快了,在一大堆 AI 工具的轰炸之下,无数通常人已经不那么在意一个新的大模型能答对几多数学题,反倒是对 Agent 能干什么活更有兴致。

把 Agent 变「牛马」,AI 要给打工人打工 ?

先说 ChatGPT for PowerPoint,加了 add-in 之后,PowerPoint 右边会出现一个 ChatGPT 侧边栏,通知它「做一份面向投资人的产品演示,从上周 Outlook 里找项目进展」,它会拉数据、天生内容、排好版,全程不脱离 PowerPoint。能连 Gmail、Outlook、SharePoint,也就是说它在尝试「助你整合信息」,不只是「助你天生」。

现实用下来,天生一份结构齐全的初稿速度快,开会前一时要一份 PPT 的场景根基够用。OpenAI 自己也坦诚,复杂的模板处置和字体排版临时还不支持。雷科技此前也专门针对这个插件做了具体的履历汇报,感兴致的伴侣能够点击查阅。

(图源:雷科技造图)

说切实的,像这类 AI 工具插件,并不罕见,性质上它们还是在一个专项的场景里提供援手,甚至目前还都不太成熟。但腾讯推出的马维斯不一样,它是一个网状式 Agent 智能体合集,一个主 Agent 在上面两全工作,下面调度 File、Computer、App、Browser、Search 这些专项 Agent 并行执行,把系统、文件、利用、算力、跨端节造都纳进统一个中央层。你通知它「助我找上周 PM 发给我的那个 Agent 架构图 PPT,文件名忘了,保留在桌面」,它会扫文件内容、做语义理解,而不是在文件夹里按关键词搜索。

(图源:雷科技造图)

现实上手试了几个场景,好比最起头我们让它拉个复盘会必要筹备的资料。马维斯的回覆先做会前筹备表,再给 90 分钟议程,挨次切合现实工作流,还把会前作为拆成了可分配的工作:运营拉线索质量数据、产品汇总客户反馈、销售整顿卖点问题,每项都有掌管人和预期产出。它很聪明的点在于,会把「卖点不明显」翻译成「整顿客户原话和具体场景」,这很实用。

再好比把一份 Word 经营简报和一张 Excel 明细表同时上传,让它找销售额、毛利、地域排名,以及有没有显著异常。它挪用了 File Agent,把两份文件跨表串联起来,给出了销售额 2,357,512、毛利 836,257、华南地域最高,还把反复客户电话、空掌管人、零数量售后单、异常大单这几类问题都列出来了。

当然,期待功夫比力长还是不太能忽视的。单一的开场问答约莫要 30 秒,不是瞬时;文件分析的话,从提交到最终了局约莫 6 分钟,并且中央过程的颗粒度不够细,你能看到 File Agent 在处置,但不知路它读到哪里、还要多久。对于「我手上有资料、开会前想急剧扫一遍」的场景,6 分钟还是能够接受的。

(图源:雷科技造图)

不外呢,马维斯最近能成功出圈,我以为还是和他的设计有关。在侧边栏我们能够看到一个接赘办公室」的页面,打开是一个白色 3D 办公室场景,Marvis、App Agent、Browser Agent 像几个员工坐在各自的工位上,右侧展示今日工作实现数、Token 亏损和进行中的工作。它用有趣的动画,直观地把 Agent 与 Agent 之间是若何合作、若何分配工作的过程展示出来,相比起单调蹩脚的工具,「AI 牛马」的形象太深刻人心了。

不论深度若何,从在 PowerPoint 里助你一键出稿,到在整台电脑上助你调文件、开会议、扫异常,它们都指向统一个方向:AI 在从一个回覆问题的工具,造成一个坐在工位上处置杂活的同事,区别只是这个同事是干杂活,还是干专精的活。

腾讯OpenAI谷歌们拼尽全力抢夺「AI 工位」

这一轮抢地位的热度,很大水平上是 OpenClaw 烧起来的。

OpenClaw 的前身叫 Clawdbot,奥地利独立开发者 Peter Steinberger 在 2025 年 11 月做出来的,开源、能够跑在本地。起初没有几多人把稳,直到 2026 年 1 月几个视频传开,好比「AI 自主买车」「30 分钟实现代码迁徙」,开发者圈子一下子炸了。Clawdbot 两次因商标问题改名,最终定名 OpenClaw,从第一个版本到 GitHub Stars 破 25 万,只用了约莫 60 天,速度比 React 十年堆集的还快。首创人随后在 2 月参与了 OpenAI,持续做 Agent 方向。

OpenClaw 之所以能爆,不只是由于它新鲜,而是它第一次让通常用户真实感触到「AI 在助我干活」是什么感触,而不是「AI 在助我回覆问题」。它能读本地文件、操作利用、挪用浏览器、执行多步骤工作,靠一套叫 ClawHub 的技术注册表把 LLM 和真实工具连起来。这套架构证了然一件事,那就是把 AI 造成一个真的在电脑上干活的角色,这件事技术上是能够做到的,并且用户愿意用。

(图源:雷科技造图)

OpenAI 最起头推出 Codex 的时辰,它还只是一个比力单纯的 AI 代码工具,给开发者写代码、建 bug、提 PR 用的。但从 2025 年 5 月到此刻,Codex 偷偷造成了另一个器材——它能操作电脑、运行内置浏览器、处置图片、跨工具执行工作,还参与了「Goal Mode」,也就是你说一个指标和成功尺度,让它自己持续跑,知路工作实现。

这个变动不是 OpenAI 一路头就规划好的产品路线,一个足够能干的 Agent,只有在某一个场景里证了然自己,就会天然地往相邻工作扩张。编程之后是代码调试,调试之后是项目治理,项目治理之后是操作浏览器、处置文件、理解高低文等等。

这也是为什么腾讯要从操作系统层级切入,Google 要把 Gemini Spark 做成 24 幼时不休线的持续 Agent,微软要在 PowerPoint 里推动 Agent Mode,而不是持续升级那个已经够用的谈天窗口。Gemini Spark 内置了对 Gmail、Google Docs、Sheets、Slides 的原生挪用权限,性质上,他们都在抢一个地位——「AI 工位」。

(图源:雷科技造图)

「AI 工位」最主题的底子不是一台装了 AI 软件的电脑,也不是桌面上多出来的一个谈天框。更正确地说,AI 工位是一种新的工作关系,当人把指标、资料、权限和验收尺度交出去,AI 就在文件、利用、浏览器、系统和云服务之间调度作为,人从执行者造成治理者、审核者和最后拍板的人。当然,这其实就是把 AI 当「牛马」用。

AI 办公加快迭代,通常人成最大受益者

AI 工位对通常人的意思,不是让每幼我忽然占有一个宏伟上的智能办公室,而是把「我亲自操作软件」造成「我分配一件工作」。人不再必要记住资料放在哪个文件加注哪个利用掌管哪一步、输出要复造到哪里,而是把指标说明显,让 AI 去找、去读、去整顿、去挪用工具,最后把了局交回来,就像你在用马维斯的时辰,你能够看到哪个 Agent 被你挪用,哪个 Agent 又去「摸鱼」了。

这也是为什么它会比单点工具更适合通常人,也更是大厂们想要打劫的入口。一个 PPT 插件再好,性质上还是助你做一份 PPT;一个真正成熟的 AI 工位,除了实现这份 PPT,还会顺便助你筹备好汇报的其他需要。这就是插件和 AI 工位的区别。

(图源:雷科技造图)

当然,目前来说,通常人会最先感触到AI 工位的副作用,好比 AI 要替你干活,就必须看见更多文件、拿到更多权限、理解更多高低文,以前你把一句话丢给谈天机械人,错了大不了重问,此刻把一串工作交给 Agent,错的可能是文件、数据、日程、体式,甚至是一次对表发送。所以 AI 工位真正遍及之前,用户必要学会的不是更复杂的提醒词,而是更明显地界说指标、限度天堑、查抄了局。

但至少,AI 工位把我们从「打工的牛马」中解放出来,这就是它爆火的主题原因。

@储世昌:终结者4在线观看,特斯拉停产Model S/X意味着什么
@王文英:赵心童第一功夫祝贺吴宜泽夺冠
@赵吟琪:警方3幼时追回价值30万被盗金条名表

【网站地图】