起源:神23舷窗已进行适应性改进作者:
AI编程工具遍及背后:效能提升的假象与代码守护的隐患
IT之家 5 月 31 日新闻,钻研人员发现,2026 年,AI 编程工具已然成为开发者离不开的副手。
但还有钻研者提醒,只管 AI 无疑能让法式员写代码的速度变得更快,代码质量却不定随之提升,这在将来可能会埋下诸多隐患。
具体来看,驰名人为智能钻研尝试室 METR 在 2026 年 2 月颁布了一项出乎意料的结论:如今绝大无数开发者哪怕只是处置少量工作,也离不开 AI 工具。
此前在 2025 年,该机构曾颁布过一份极具开创性的钻研,聚焦 AI 对编程效能的影响。本次 METR 本筹算跟进更新这项钻研,对比开源开发者手动编码与借助 AI 编码的耗时差距。
在 2025 年的钻研中,开发者们都暗示 AI 提升了自己的工作效能,可最终数据了局却令所有人意表:AI 现实上拖慢了整体工作进度。AI 天生代码的速度固然很快,但开发者要额表破费大量功夫排查、建复缝隙,还要不休疏导 AI、期待其实现工作。
当 METR 团队想要复刻这项尝试,以此评测 AI 技术与法式员能力的进取时,尝试却无法发展。
钻研人员坦言,开发者们不愿参加尝试,原因是哪怕只是为了实现测试,他们也无法接受脱离 AI 工作。
无奈之下,METR 在同年 5 月转而颁布了一份调查问卷,由技术从业者自主反馈 AI 带来的效能提升。不出所料,受访者普遍以为,AI 让自己在公司里的工作价值翻了一倍。
然而,近期再三爆出的词元(token)滥用导致成本激增的有关新闻,再加上多项最新钻研,都让这类主观自评显得站不住脚。
IT之家把稳到,用词元使用量衡量 AI 办公效能(即“词元量化查核”)是 2026 年以来的行业风潮,而这股热潮如今或许已经走向闭幕。
据《金融时报》本周报路,亚马逊关停了内部名为“基罗排名”的词元用量排行榜。原因是员工为冲榜单过度挪用智能体,不仅恶意刷高词元亏损,还大幅增长了运营成本。这一景象也印证了:使用 AI 并不等同于工作效能提升。
另据科技媒体《The Information》新闻,优步仅用四个月就耗尽了 2026 整年的 AI 预算。公司首席运营官安德鲁?麦克唐纳近日在一档播客节目中坦言,高额投入并未带来项目体量或工作效能的内容性增长。
法式员、作者詹姆斯?肖尔在一篇爆红于 Hacker News 的博客文章中言简意赅地指出:AI 天生的代码也没能削减后续的代码守护工作,反而可能让守护压力变得更大。
他写路:“就算你此刻写代码的速度快了一倍,也得祷告守护成本能随之减半。不然只会陷入困境 —— 你换来的只是一时的速度提升,却被套上了永远的运维镣铐。”
还有更多证据批注,AI 会加剧代码守护难题。
靠得住性工程代理草创公司 Entelligence AI 的首创人兼首席执行官艾斯瓦里亚??ǘ洳嫉囊惶跬莆囊⒖矸鹤,她暗示,各大企业近 44% 的 AI 词元亏损,都用于建复 AI 自身天生的法式缝隙。与此同时,代码审核工具厂商 CodeRabbit 分析开源代码归并要求后发现,AI 编写的代码出现问题的概率,是人为代码的 1.7 倍。
客观来说,上述数据来自售卖 AI 代码审核工具的企业,未免带有自利偏差。
但独立钻研团队也得出了类似结论。新加坡治理大学的钻研人员在 4 月颁布汇报警示:AI 天生的代码会给现实软件项目埋下持久守护隐患。
既然法式员已经高度依赖 AI 副手,该若何解决这些问题?
主推 AI 编程智能体的厂商给出的规划是:开发者能够借助同类工具,急剧处置 AI 产出代码所带来的繁芜建复工作。驰名 AI 编程智能体 Devin 的开发方 Cognition 公司首创人兼首席执行官 Scott Wu 便持这一概想。
不外他也坦言,只管 Devin 可能独立实现工作,但综合分歧工作来看,它目前的能力仅介于低级与中级法式员之间,远达不到“交付之后就无需过问”的梦想状态。
新加坡治理大学的钻研团队则提出了更侧重人的解决思路:法式员要像精通常用编程说话一样,吃透 AI 的能力天堑,明显它善于和不善于的工作;同时搭建专门适配 AI 流程的美满质检系统,并且必须像审核新人代码一样,逐一对 AI 产出内容进行详细核查。
钻研人员还提到(Scott Wu 也对此暗示认同),软件架构、安全设计这类顶层主题工作,仍该当由人类法式员主导实现。
@吴钰婷:国模奥雷,雷军操作手机时用稿子遮挡@毕俊尧:泽连斯基称乌军成功击沉一艘俄舰艇
@陈家弘:广西载15人皮卡车坠河已致2死8失联
热点排行
- 1 91日韩国产
- 2 蜜桃app
- 3 影音先锋5566av
- 4 亚洲最大a v
- 5 性爱啪啪啪男女
- 6 插表姐
- 7 一家人乱欲小说
- 8 国产成人电影w74.ww.cc
- 9 春暖性花开