起源:莫雷加德获乒乓球欧冠决赛MVP作者
亚马逊叫停AI用量排行榜,把烧Token当绩效查核可行吗
亚马逊下线了一个追踪内部使用AI(人为智能)的排行榜,原因是员工刻意刷量,推高了公司算力成本。
据《金融时报》5月29日报路,亚马逊在本周通知员工,旗下“Kirorank”榜单已终场服务。这一榜单依附亚马逊内部开发者平台Kiro,正本用于给用户的AI活动量打分,设立初衷是为推动AI在业务场景的利用,了局壮志未酬。一些员工为钻营排名,铺排AI智能体执行无意思的操作,钻营Token使用量最大化,造成公司算力资源过度亏损。
不止亚马逊一家,Meta、微软、谷歌等硅谷巨头也出现内部比拼Tokenmaxxing(Token最大化)的情况。这股风尚还从硅谷舒展至中国,有网友发帖称国内个别大厂起头查核Token亏损量,将此与转正、年度绩效、提升挂钩。
当烧Token成为KPI,企业若何预防内部陷入“为用AI而用”、盲目刷量冲榜进而引发算力空耗的怪圈?更深层的问题是,Token亏损量高能否同于产出价值高?相比烧了几多Token,有无更成熟、不变且可行的AI价值衡量尺度?
硅谷“卷”Token用量
所谓Token是大模型处置文本的最幼单元,每一次提醒词输入和模型输出城市亏损Token——1个Token既可所以一个单字,也可所以一个常见的词语,或者一个标点符号、空格。在国内,国度数据局于今年3月将Token译为“词元”,以为这不仅是智能时期的价值锚点,更是衔接技术供给与贸易需要的“结算单元”。
随着AI利用的加快推动,Token的亏损正被越来越多厂商视为反映Al的发展规模和活跃水平的指标。在硅谷,最近鼓起了一股名为Tokenmaxxing(Token 最大化)的风潮——蕴含亚马逊、Meta、微软等科技巨头为激励员工积极使用AI工具,将此纳入查核指标,有的公司甚至设置内部排行榜,通过数据看板实使毓示员工Token亏损数据。
以Meta为例,今年4月初,一名Meta员工开发了名为 “Claudeonomics” 的内部仪表盘,用来统计公司超8.5万员工的Token使用量,并展示了前250名的名字。据媒体报路,30天内,Meta全员“烧掉”了60万亿Token,排名第一的员工均匀亏损2810亿Token——按Claude公开的API价值折算,“榜一大哥”单月亏损了公司超过 140万美元的AI用度。不外这份榜单,被一家科技媒体曝光后已经下线,创建者暗示“因数据被表部门享,决定临时关关。”
不止科技公司,流媒体巨头迪士尼也参与Tokenmaxxing行列,在内网上线了一块名为“AI Adoption Dashboard”的看板,实使毓示员工挪用美国人为智能公司Anthropic旗下Claude模型的频率、要求次数、Token亏损量。
这些行为批注,一些公司治理层在将Token亏损量纳入查核系统,用以衡量员工的AI能力。今年3月,英伟达CEO黄仁勋在GTC大会直言,若是一位年薪50万美元的工程师,一年亏损不掉25万美元的Token,他会深感焦虑;迫恃购俺鲆裈oken当工资发,每年给工程师一笔相当于一半薪水的Token预算,“让他们的能力放大10倍”。
在以黄仁勋为代表的AI大佬的叙事框架里,Token正成为一种出产力指标,将来还可能造成薪酬福利、新钱币。不外,这样的行业叙事也面对证疑,其中一个现实问题是,Token亏损涉及成本问题,大量的AI投入最终有几多转化成了有效的产出?当Token用量与查核绑定,这将激励员工进一步拥抱AI海潮,还是可能被异化?
亚马逊的实际案例,给出了一种答案。5月29日,据《金融时报》报路,亚马逊近期关停了内部AI使用排行榜KiroRank。这一系统最初用于评估开发者平台 Kiro 的用户AI使用阐发,但部门员工利用AI智能体执行大量无效工作“刷榜”,以至亚马逊的算力成本大幅攀升。
此前,亚马逊被曝设定查核指标,要求超80%的研发人员每周必须使用AI工具,并通过内部排行榜实时统计Token亏损量。为应对查核压力,不少员工出现了刷数据的行为。
据亚马逊介绍,这份榜单由部门员工自觉搭建,初衷是让各人看到AI的赋能作用,公司的主题指标是提升运营效能,但了局壮志未酬。亚马逊高级副总裁戴夫·特雷德韦尔(Dave Treadwell)告诫员工,“请不要为了用AI而用AI。”
另据媒体报路,亚马逊已起头改用“尺度化部署量”作为新查核指标,更关注工程师用AI产出有效代码的频率,而非单纯的Token亏损量。
当Token成为KPI,有人用昂贵的算力表演忙乱
除了亚马逊表,Meta等科技公司员工也被曝存在刻意刷Token亏损量、抬高内部排名的问题。若何对待员工的Tokenmaxxing行为?
艾媒征询CEO张毅通知南都记者,硅谷企业推出Token亏损榜单,主题是借助可量化数据急剧推动AI工具遍及,用排名竞争倒逼员工自动拥抱AI,加快企业数字化转型。但在排名压力下,员工必然会进行无效挪用,这不仅浪费算力资源,还会分散工作精力,违背AI降本增效的初衷,也反映出企业AI治理系统存在短板。
大厂员工用昂贵的算力表演忙乱,问题到底出在哪里?张毅直言,本原在于企业用单一的Token使用频次代替价值查核,这种单一量化指标容易引发大局主义问题。
南都记者把稳到,这股风尚也起头舒展至中国国内。近期,有网友发帖称某大厂绩效将参考Token亏损数据,或影响转正、年度绩效、提升。与此同时,为了激励员工拥抱AI刷新,腾讯、阿里、字节等企业相继颁布了与Token有关的政策,蕴含提供内部AI工具的免费额度、表部采办AI工具可报销,为技术和算法等主题岗位配置Token补助等,也有企业以优良案例评优、创新项目嘉奖等方式激励员工使用AI。
当烧Token成为KPI,若何预防陷入“为用AI而用AI”的怪圈?张毅暗示,Token亏损量仅直观反映AI挪用频次与使用活跃度,只能注明员工对AI工具的使用水平,无法直接等同于工作效能与业务价值。更合理的衡量指标应聚焦业务了局,好比工作交付效能、内容可用率、谬误返工率、成本节约额、业务创新成就等,从投入产出角度评估AI使用的真实效力。
值得一提的是,随着算力账单的增长,一些科技公司起头审视Token能否烧出价值。好比,Uber首席运营官麦克唐纳德(Andrew Macdonald)在近期的一档播客中暗示,更高的Token使用量并没有转化为一致、有效的职能增长,公司越来越难以为持续攀升的AI支出做出合理诠释。
业内也不乏质疑“唯Token论”的声音。今年3月,Gartner钻研副总裁孙鑫曾撰文指出,Token数量在结构上并不合用于评估AI成功与否,反而可能误导企业机构的决策者,重要有三点原因:以Token为信号会导致错位激励;Token亏损与业务价值脱节;Token数量在技术上无法实现厂商之间的直接比力。
百度首创人李彦宏也在思虑,AI时期的怀抱衡到底是什么?他以为,Token只是代表成本,并不代表收益;它衡量的是投入,而不是产出。另表,Token亏损有没有效率、产出了什么价值——这些Token自身无法回覆。
5月13日,李彦宏在Create2026百度AI开发者大会正式提出,进入智能体时期,衡量一个平台和生态的繁华,比起Token亏损,更应该关注“日活智能体数”(Daily Active Agents,简称DAA),关注有几多Agent在给人类干活,并交付了局。
此前,美国CRM(客户关系治理)巨头Salesforce尝试提出一个新概想:智能体工作单元(AWU, Agentic Work Units),即智能体实现的一项独立工作,它代表原始算力真正转化为现实工作价值的过程——既可所以实现一次指令交互,也可所以走完一轮逻辑推理,更主题的是实现一次工具挪用。
自智能体鼓起以来,行业以Token亏损量评价AI使用功效,但Token只能体现于AI的交互频次,无法衡量其现实落地的工作成就。当企业试图将Token用量纳入KPI,有必要思虑怎么预防这样查核机造跑偏。将来Token狂热会退散,若何剔除无效的AI账单,回归价值创造自身,也是摆在企业刻下的必答题。
采写:南都N视频记者李玲 发自北京
@陈大秀:揭秘蓝月亮论坛57948,湖南拟新增三所本科高校@何乔友:银行为何釉祓头猛推大额存单
@柳俊蓁:中国有力护航民企“轻装上阵”
热点排行
- 1 大家乐飞飞官方网站
- 2 58乐彩平台
- 3 彩1安卓版
- 4 天博综合官网
- 5 九游j9官网首页进入网页版
- 6 bg视讯厅平台
- 7 雷火·电竞中国网页版登录入口
- 8 网上牛牛开户
- 9 斗球苹果手机下载安装