k8凯发天生赢家

起源:10岁男孩分享想书的意思作者: 陈

起源:10岁男孩分享想书的意思作者: 陈东奇:

30天烧掉60万亿 ,扎克伯格没进前250:大厂AI沦为KPI游戏

新智元报路

【新智元导读】亚马逊给员工的AI工具装了计量器 ,官方说不查核 ,经理盯着排行榜不放 。Meta内部榜单30天烧掉60万亿token ,扎克伯格没进前250 。然而Jellyfish数据打脸:刷10倍token ,产出只多了1倍 。谁在为这场怪诞游戏火上加油?

硅谷大厂 ,起头盛行用token摸鱼了?

英国《金融时报》近日报路 ,亚马逊的一些员工 ,正坐在工位上让一个叫MeshClaw的内部AI工具 ,跑那些底子没必要的工作 。

他们不是在搞尝试 ,也不是赶项目 ,而是在刷token 。

MeshClaw能发邮件、处置Slack、部署代码 ,是一个真正能够「代劳」的AI智能体 。据报路 ,亚马逊还给它配了一张内部排行榜 ,实时追踪每位员工的token亏损量 ,指标是超过80%的开发者每周都在用AI 。

3名知恋人士泄漏 ,部门员工随即找到了新的生政战术:用MeshClaw跑没有必要的工作 ,专门为了拉高榜单上的数字 。

在硅谷 ,这个行为有了专属名词:tokenmaxxing(疯狂刷AI用量) 。

亚马逊说token数据不用于绩效评估 。但据报路 ,多名员工并不相信 ,有人直言感触到「很大压力」 ,并且不只是要用AI ,还要用得「最多」 。

亚马逊不是唯逐一家 。Meta内部排行榜「Claudeonomics」(Claude经济学)从前一个月烧了60万亿token ,扎克伯格自己都没排进前250 。

这是2026年5月 ,全球最有钱的几家公司同时进入了一种新的工作状态 。大厂AI起头沦为一种KPI游戏 。

Jassy的备忘录

员工读出了另一层意思

MeshClaw是亚马逊给员工的AI入口 ,它背后接的是Claude 。

亚马逊推AI的力杜仔木懿见 。据报路 ,公司设定了一个内部指标:超过80%的开发者每周必须用上AI工具 ,并配套上线了内部排行榜 ,追踪每幼我的token亏损量 。

初衷当然是好的 ,但一到员工手里就变形了 。问题也不全在员工这里 ,token焦虑的源头其实还在公司最高层 。

2025年6月 ,亚马逊CEO Andy Jassy向整个员工发出了一封公开备忘录 ,直接建议员工「只有有机遇 ,就去使用和尝试AI」 。他还写路 ,那些拥抱AI转变的人 ,将「处于更有利的地位 ,产生高影响力」 。

https://www.aboutamazon.com/news/company-news/amazon-ceo-andy-jassy-on-generative-ai

Jassy的备忘录中 ,「对AI维持好奇……只有有机遇就用AI、试AI」这句话被员工读出了另一层意思:tokenmaxxing 。

Jassy在备忘录中将「拥抱AI」与「产生高影响力」直接挂钩 ,让每一个通常员工陷入一种token焦虑:我此刻的AI使用量 ,够不够?

更关键的是 ,Jassy还在统一封备忘录里写明:将来几年 ,随着在公司领域内宽泛使用AI ,亚马逊预计企业员工规模将降落 。

亚马逊官方暗示token数据不会用于绩效评估 ,但据员工泄漏 ,经理依然在盯着排行榜 。在这种氛围不言而喻:谁的token用得多 ,谁就更安全 。

因而 ,正本不必要AI的活儿 ,也要丢给AI跑一遍 ,为的就是让榜单上的数字好看 。

这正是互联网OKR系统下经典的反向打卡 ,员工在跟一个量化指标博弈 。

Meta 更离谱 ,CTO 亲自喊「刷」

Meta ,在统一周也被《The Information》曝光了内部AI排行榜 。

一位叫Ash Bhat的员工独立搭了个名为「Claudeonomics」的工具 ,该仪表盘追踪约8.5万名员工的token使用量 ,并以排行榜大局展示 ,30天累计亏损60万亿token ,单个顶级用户烧了2810亿token 。

有趣的是 ,扎克伯格自己没进前250 ,CTO Andrew Bosworth也没进 。

排行榜被媒体报路之后 ,作者自动把它下线了 。但Bosworth随即在Forbes上公开站台:公司最优良的工程师 ,花掉相当于自己一年工资的token ,效能却提升了5到10倍 。「这就像白送钱 ,持续刷 ,不设上限 。」

无论是员工被迫 ,还是CTO至心激励 ,亚马逊和Meta这两家全球最有钱的公司 ,都已经把tokenmaxxing造成了一衷祗业文化 。

也不只这些驰名大厂 ,企业AI平台公司Writer的CEO May Habib在接受《华尔街日报》采访时 ,婉转认可了三件事:token是能够被「刷」的指标 ,员工会用公司平台做个人项目 ,并非每一个token都在创造贸易价值 。

这些她全知路 ,但她的态度依然是要推:

一旦你起头推算单个智能体行为的投资回报率 ,你就始终不会真正用起来了 。

Writer内部排行榜的月度冠军亏损量靠近110亿token ,亚军超过60亿 。Habib公开暗示自己在盯着这张榜看 。

红杉本钱合资人Sonya Huang更是直言:「我们都应该tokenmaxxing 。」

Huang说 ,排行榜是个不美满的指标 ,她认可 ,「但对你的公司来说真正重要的问题是:我的员工有没有彻底转造成AI原居民?要做到这一点 ,你必要让他们进入这种tokenmaxxing的状态 。」

所以争论的性质并非「榜单好不好」 ,而是在什么规模和阶段、对谁有效 。

对Writer这样几十人的草创 ,CEO亲自盯榜点名表彰 ,那是文化信号 ,成效直接 。

对Jellyfish追踪的12000名开发者 ,token榜造成了一个各人都知路在玩、但都不愿明说的游戏 。

而亚马逊罕见十万名员工 ,游戏的规模齐全分歧 ,副作用也齐全分歧 。

只换来2倍产出

很快 ,就罕见据来打脸这种token榜单的刷榜行为 。

工程智能公司Jellyfish对12000名开发者、200家企业的Q1 2026数据做了分析 。

他们得出一个扎心数据:

最高使用层的开发者在每个PR上亏损的token约为中位数的10倍 ,但PR吞吐量只达到约2倍左右 。

烧了10倍的油 ,只跑了2倍的路 。

Jellyfish数据:token用量最高组产出是最低组的2.8倍 ,但每PR亏损token相差近千倍 。烧更多token ,换来的产出远不成比例 。

成本数字则更是刺眼 。

Jellyfish用Claude API公开定价做了估算:中位数开发者每月在AI编程上花约52美元;到了90百分位的高用量用户 ,这个数字跳到691美元 。

每条PR的token成本 ,从最低用量层的0.28美元 ,直接飙升到最高用量层的89.32美元 。

统一项工作 ,有人花了0.28美元实现 ,有人花了89美元 ,并且后者做出来的也并没有好几多 。

Jellyfish的AI钻研掌管人Nicholas Arcolano直言:「CFO已经起头追责了 ?突г敢馕狝I花钱 ,但不能不拿出掌管任破费的证明 。」

他还举了一个看似高效、实则怪诞的例子:

我让五个AI智能体各自做一个版本 ,而后挑最好的 。大量工作被抛掉 ?赡苷迳匣故潜热俗霰阋 ,但比直接做一次贵多了 。

工程分析平台Faros.ai上关于22000名开发者的数据 ,刚好补上了故事的另一半 。

AI工具的确让代码产出提速了:工作实现量上升34% ,齐全职能?椋╡pic)交付量上升66% 。但同期 ,每位开发者的bug数量增长了54% ,代码审查功夫升至约5倍 ,代码返工率(code churn ,即删除行与新增行之比)在高AI选取环境下上升了惊人的861% 。

指标在飞涨 ,效能却并没有跟上 。

这就是经济学里驰名的Goodhart定律在现实中的一个样本:当一个衡量指标造成了指标 ,它就不再是靠得住的衡量指标了 。

token亏损量造成KPI的那一刻 ,它就失去了作为效能代理指标的意思 。

D.A. Davidson的科技钻研主管Gil Luria对Fortune暗示:「你设计什么激励 ,就会得到什么行为 。你通知人们多用某种资源就能成功 ,他们当然会多用……这看起来不太健全 。」

每刷一个token

都在给本钱背书

跳开token使用者的视角 ,还有一层逻辑值妥贴心 。

亚马逊、微软、谷歌、Meta这四家超大规模云厂商 ,2026年的归并本钱开支已经逼近7000亿美元 ,部门华尔街机构预测2027年将突破1万亿美元 。

这是人类汗青上单一技术方向上最大规模的一次集体押注 。

这笔钱当然要有个说法 ,这也是投资者要问的第一个问题:钱花在了哪里 ,需要是真实的吗?

今年4月 ,Anthropic颁发扩大与亚马逊的合作 ,承诺将来十年向AWS技术投入超过1000亿美元 ,用于训练和运行Claude 。

目前 ,超过10万家企业客户通过Amazon Bedrock运行Claude 。Anthropic的年化营收已超过300亿美元 ,从2025年底的约90亿美元急剧增长 。

2026年4月 ,Anthropic颁发扩大与亚马逊合作 ,承诺十年向AWS投入逾1000亿美元 。

在这个结构里 ,亚马逊既是Anthropic的最大投资者 ,也是其最重要的云基础设施提供商 ,还是Claude最大的企业分发渠路之一 。

Luria将这种关系称作:「循环活动(circular activity)」 。

统一批大公司投资了AI的上游供给商 ,把算力卖给表部客户 ,同时也在内部疯狂亏损自己的算力 。内部token使用量的增长 ,既是员工被推着用的了局 ,也在客观上成为「AI基建投资物有所值」的佐证 。

从这个角度来说 ,员工刷的每一个token ,都在给本钱开支的合理性背书 。

Arcolano给出了他以为正确的蹊径:不要钻营少数人的极限用量 ,要把更多人推到曲线的中央地带 。

宽泛、适度、持续的AI选取 ,比少数人的极端亏损更划算 ,也更可持续 。他建议治理者换一个指标:别看token总量 ,看每条PR亏损了几多token 。

Arcolano提到的是一种精密化视角 ,但本钱叙事往往是更为粗放的 。

我们正处在这样一个奇怪时刻:AI工具确切实提升出产力 ,数据已经证了然这一点;但萦绕AI使用率成立的激励系统 ,在以难以觉察的方式 ,扭曲这所有 。

Goodhart定律在上个世纪就有人提出了 ,但每一次技术刷新 ,每隔一段功夫 ,它就会找到一种新的阐发大局 ,这一次的主角是token 。

参考资料:

https://fortune.com/2026/05/12/amazon-tokenmaxxing-claude-ai-capex-meta-gil-luria/%20

https://www.ft.com/content/8ee0d3ef-9548-422d-8ff1-ebd48ad4b2ca%20

https://www.businessinsider.com/ai-tokenmaxxing-fails-as-productivity-strategy-jellyfish-2026-5%20

https://jellyfish.co/blog/is-tokenmaxxing-cost-effective-new-data-from-jellyfish-explains/%20

https://www.faros.ai/blog/tokenmaxxing

编纂:元宇

@吴初燕:jizzwww ,骑士老板包大巴送球迷远征客场助威
@陈品尧:刘建宏:中国U19土伦杯阐发带来惊喜
@冯裕翔:印杜孜客:中国清洁水平令人震惊

热点排行

【网站地图】