k8凯发天生赢家

新闻中心 新闻中心

对话EverMind:4个月做到SOTA ,要给所有Agent装上持久影象

作者 | 吴瑞琪邮箱 | rachelw

作者:陈威云
颁布功夫:2026-06-03 17:33:08
阅读量:5

对话EverMind:4个月做到SOTA ,要给所有Agent装上持久影象

作者 | 吴瑞琪邮箱 | rachelwu@pingwest.com

“人类智能 = 推理 + 持久影象” 。

当AI 推理能力的较量进入白热化 ,整个行业起头意识到:infra层面的影象缺失 ,正成为限度 AI 走向个性化与自进化的最大瓶颈 。

没有持久影象的 Agent ,就像一个固然考上了清华、但每天醒来都不意识亲妈的天才 。而大量涌入影象赛路的公司 ,好多性质上只是在做向量数据库 ,把数据存起来 ,等人来检索 。

EverMind 想做点不一样的 。这家由盛大集团孵化的公司 ,定位是为所有AI Agent提供一个通用的"影象层"(Memory Layer) 。它的主题产品EverOS是一套开源的持久影象系统 ,开发者能够把它接入自己的Agent ,让AI不仅能记住用户的汗青对话和偏好 ,还能像人一样对影象进行整顿、更新 ,甚至从从前的经验中进建和进化 。

EverMind的CEO邓亚峰 ,是一位在AI领域深耕二十余年的老兵 。他毕业于清华大学 ,曾任360集团副总裁兼AI钻研院院长、格灵深瞳CTO ,在推算机视觉、多模态AI和AI造药等领域深耕多年 。2025年 ,他参与盛大 ,带队从零启动EverMind的持久影象项目 。团队仅用四个月就在多项影象评测上达到了SOTA 。

我们与邓亚峰进行了一次对话 ,聊了聊他为什么押注持久影象 ,以及这项技术到底要解决什么问题 。以下是对话实录 ,为阅读履历稍作编纂 。

为什么是 Long-term Memory(LTM)

硅星人:在视觉、多模态、AI造药这些领域都做到过很好的成就之后 ,您是怎么锁定"持久影象"这个方向的?

邓亚峰:做AI造药的时辰我最大的体味是 ,当数据产生得慢、不能急剧迭代 ,技术进取就是有限的 。所以之后选方向 ,我就想找一个能急剧做数据迭代关环的领域 。也思考过机械人 ,但落地周期太长、数据获取难题 。转向说话模型之后 ,又面对大模型在吞噬所有的问题 。OpenAI、Anthropic车轮滔滔 ,创业公司的空间越来越幼 ,必须找到一个有独个性的细分赛路 。

持久影象刚好满足这几个前提:它是下一代AI的必备个性 ,钻研得很少 ,跟推理能力相对正交 ,有很强的战术独立性 。当使剽个方向相对冷门 ,各人还在做LLM模型、Agent、post-training ,但我以为没有影象职能的Agent ,用户履历肯定是受限的 。今天这已经成了行业共识 。

盛大这边的视角也很怪异 。陈天桥先生从前十多年一向在sponsor脑科学和mental health 的钻研 ,对人类智能的机造机理极度感兴致 。这几年AI的发展让他起头思虑一个问题:人类智能刚好能够简化为“推理+持久影象” ,推理这一半已经有无数巨头在卷了 ,持久影象是不是一个极具战术独立性的方向?这个判断和我自己的思虑刚好吻合 。

硅星人:在您看来 ,Long-term Memory到底要解决什么主题问题?

邓亚峰:三件事 。

第一 ,突破有限的高低文长度 。此刻模型高低文窗口根基到了1M token ,但影象数据量超过这个限度就没法用了 。现有的RAG或压缩规划都是工程妥协 ,不是最优解 。我们做memory ,性质上是助模型更好地治理高低文 ,在极高压缩率、低token亏损的前提下 ,让模型有效利用无限的汗青信息 。

第二 ,实现真正的个性化 。人在互换中会为对方成立profile:身份、偏好、价值观、说话风格、指标 。LTM就是助Agent构建和守护这样的用户画像 ,交互越多越懂你 。当然 ,LTM的个性化设置不仅限于Profile Memory 。

第三 ,Self-evolving ,自进化 。今天的AI靠offline training提升能力 ,在和用户交互的过程中并不会变得更聪明 。我以为下一代AI肯定是在交互中进建的 ,是一种online learning 。Long-term Memory是实现自进化的关键:通过纪录和分析交互的成功与失败 ,总结最佳实际 ,知识和思虑方式都随之进取 。

这三件事和人类进化出持久影象的道理是一样的 。远古时期 ,哪里水草丰茂你要记住 ,哪里有危险你也要记住 ,同时你还要凭据季节和气象去预测将来 ,这片草地会变得更湿润还是会发洪水 。并且钻研批注 ,持久影象援手人类组织训练样本 ,把分歧经验分类聚合 ,所以人的泛化能力远强于模型 。模型是把所罕见据不做分辨地抛进去训练 ,很容易过拟合 ,或无差距求概率 。人脑的持久影象机造让进建更有结构 ,泛化更强 。AI的Long-term Memory要做的 ,性质上也是这件事 。

Memory Layer 和 Agent 层

硅星人:您提到的个性化和自进化 ,听起来更像Agent利用层的职能 ,不像infra layer能做的事?

邓亚峰:这是一个很好的点 。Infra layer能做一部门 。我们最近在做一个即将开源的feature ,基于memory的自进化 。分歧Agent把运行的trace放到我的memory里 ,我能够凭据成功和失败的经验去总结最佳SOP 。好比你做了一个工作成功了 ,我做了一个类似的工作失败了 ,当我把大量用户的经验堆集下来 ,就能够learn from experience 。这在影象层是能够做到的 。

若是想做得更深 ,好比基于用户反馈做强化进建 ,那的确必要Agent层和Memory Layer协同 。但Memory Layer在其中表演关键角色:助Agent层组织数据 ,就像人脑持久影象辅助进建的机造一样 。

硅星人:在您看来 ,接入Memory Layer ,Agent最直观的智能提升体此刻哪?

邓亚峰:四个维度 。

第一是效能 ,token的极致压缩 。这对节造成本至关重要 。若是k8凯发天生赢家产品能让token数极端降落 ,这件事的贸易价值是极度大的 。

第二是成功率 。我们做了基于skill的自进化机造 ,Agent能够从从前经验中进建 ,某些指标实测提升了234.8% 。好比你昨天用一个职能可能还会失败 ,但这两天有几幼我也用过了 ,系统学到了其中成功的经验之后 ,你今天再用就成功了 。系统会变得越来越好 。

第三是个性化 。分歧用户有分歧的高低文和影象 ,每幼我的副手履历都唯一无二 。我们内部有个AI Native的合作平台叫Tanka ,提供基于持久影象的AI副手 。背后的LLM和推理技术是一样的 ,但由于每幼我的影象分歧 ,聊出来的成效就齐全不一样 。

第四是自动性 。纪录了用户的行为汗青之后 ,Agent能够预测下一步需要 。好比我知路你每天这个时辰要买杯咖啡 ,我就能够提前提醒你 。再进一步 ,我甚至能够提前把事件做了 ,再问你"这是不是你要的了局?"就像一个能预判需要的好员工 ,你没有assign的工作他已经做完了 。

影象怎么更新 ,怎么"健忘"

硅星人:我用GPT时时遇到这个问题:我的生涯已经更新了 ,但它对我的理解还停在之前 。好比之前跟它聊过的人事物 ,在我现阶段的生涯里已经不重要了 ,但它还总是提起 ,就让人感触很烦 。EverMind怎么处置影象的矛盾和过期信息?

邓亚峰:k8凯发天生赢家机造分两步:在线提 。∣nline Memory Extraction)和离线进化(Offline Memory Evolution) 。

在线提取 ,信息进来后做boundary detection ,把统一topic的内容聚到一路 ,提取事实性的情景影象(episodic memory) ,再预测这个事实对将来的影响 ,我们叫forecast 。影象不只是存档 ,要能服务于将来的决策 。

离线进化 ,系统定期做几件事:在更大领域信息上提炼用户profile;做反思和刷新 ,有点像Claude Code里"dream"做的事 ,让模型回头审视之前的判断对不合;还有处置影象更新 ,通过影象聚类战术(merge) ,把类似话题聚在一路 ,矛盾信息按功夫线用最新的做update 。

忘却率直讲是更难的 。Update相对容易 ,用最新的信息代替老的就行 。但忘却有一个周期性的问题:你昨天提到一幼我 ,系统感触他重要;一星期前呢?一个月前呢?是不是就该忘了?我们此刻是在离线战术中把每条信息的功夫放进去 ,结合k8凯发天生赢家预测将来职能 ,让模型自己去揣摩这条信息的时效性 。率直说 ,在当前这个功夫点还没有做到极度梦想 ,但我以为它是一个会被逐步解决的问题 。

我的判断是:AI的"忘却"不应该是物理删除 ,数据存在磁盘上不贵 ,而是一种权重调整战术 。近期信息权重高 ,远期信息权重低 ,但必要时仍能找回 。人类为什么必要忘却?两个原因:一是人脑是低能耗系统 ,记太多器材能耗扛不 ;二是你必要基于近期信息做决策和预测 。AI不存在第一个限度 ,它只必要在决策中把时效性和重要性合理思考进去 。从这个角度说 ,AI的忘却机造现实上能够比人类更优 。

开源生态与大厂竞争

硅星人:EverOS已经在GitHub上开源 。但OpenAI、Anthropic也都有自己的影象职能 ,用户已经堆集了好多偏好数据在他们的平台上 。第三方Memory Layer怎么找到自己的地位?

邓亚峰:k8凯发天生赢家定位是做一个memory layer for agents ,将来所有Agent都必要影象职能 ,但没必要每个团队都自己建一套infra 。我们但愿成为那个协议数 。

大厂肯定会做影象 ,但第三方影象层的空间来自一个单一事实:用户不会只用一个产品 。你不会只用Claude ,也不会只用OpenAI 。你在各个产品上的汗青信息都有价值 ,所以反而必要一个真正属于自己的跨平台影象治理工具 。这件事的驱动力是用户必要 ,不是我们想做还是大厂想做 。

另表 ,memory治理不必要最顶尖的大模型 。我们用4B的模型能做到235B级此外成效 ,更快、成本更低 。对开发者来说 ,memory将来不是"能不能"的问题 ,而是性价比的问题 。

开源战术上 ,我们极度彻底:开源版和本地部署等价 ,数据齐全留在本地 ,满足隐衷要求高的用户 。同时也有云版本 ,让不想自己部署的幼团队即插即用 。最主题的算法全数开源 。我们也在做一件事 ,助用户把Claude Code、OpenAI和其他Agent里的memory数据买通 ,跨平台、跨端、统一治理 。跟好多人聊完发现 ,这是一个很刚的需要 。

硅星人:记住的信息越多 ,安全风险也越大 。这方面怎么平衡?

邓亚峰:两个层面 。信息安全 ,也就是影象会不会泄露 ,这跟云服务的安全挑战是等价的 ,必要扎实的技术保险 。另一个是系统要对敏感信息做过滤 。好比用户通知你密码、银行账号 ,我们有个vault机造 ,把高敏感信息隔离存放 ,只在特殊情况下激活 。

部署模式上 ,影象的梦想状态是云端和端侧结合 。用户的数字资产存在本地设备上 ,复杂处置借助云端 ,双方做同步 。k8凯发天生赢家模型已经能够做得很幼 ,将来设备能跑4B模型 ,推算就能够齐全数署到端上 。

若是 AI 记住了你的所有

硅星人:若是AI占有了极度长周期、极度精确的影象 ,它就不再只是工具了 。您但愿您的AI助理记住什么 ,不想让它记住什么?

邓亚峰:我感触将来最梦想的状态有两种 。一种是"贾维斯" ,24幼时随着你的AI ,你的工作和意图都通过它实现 ,它只必要你确认了局 。另一种是数字分身 。AI足够相识你之后 ,能够代表你去"打工" ,或者做Agent社交 。我们每幼我都有好多两年都不座谈天的伴侣 ,但彼此可能有值得互换的信息 。人是串行的 ,AI是并行的 ,你的数字分身能够和他的数字分身谈天 ,发现共同话题了来通知你 ,"你们两个应该聊聊这件事儿 。"这让我感触极度exciting 。

至于记什么、不记什么 ,梦想的AI要有天堑感和情商 ,知路哪些话题在感情上是敏感的 。不外有意思的是 ,人和AI的相处有时比人和人更容易 ,你天然以为AI跟你是一壁的 ,反而更愿意倾诉一些不会跟伴侣说的事件 。

硅星人:我对memory有个感触:它有点像人类对功夫感知的演变 。在腕表遍及之前 ,你出门之后其实不知路此刻是几点几分了 ,对功夫只有一个吞吐的感知 。而此刻有了手机 ,你能够随时随地知路此刻的功夫 。而人类目前对影象的感知 ,就像腕表出现之前人类对功夫的感知水平 。您感触 ,若是AI有了精确的持久影象 ,人对自身经历的感知会不会也发生类似的转变?

邓亚峰:这个迸作极度好 。此刻的人类就像钟表刚发现时的状态 ,对自己做过什么有大体感知 ,但不精确 。若是AI能长周期地精确纪录和治理你的幼我数据 ,人对自我的相识会上升到一个此刻无法设想的水平 。

并且AI的影象能力能够添补人类的一个先天限度:人的能量有限 ,所以有人善于宏观规划 ,有人善于细节 ,很少有人两样都强 。但AI的Long-term Memory能够既助你梳理三年来的大事脉络、做更有远见的规划 ,又能在你必要时精确调出三年前某个时刻的具体细节 。宏观和微观美满结合 ,这是AI在memory上真正让人兴奋的处所 。

点个“爱心” ,再走 吧

 

文章点评

未查问到任何数据!

颁发评论

◎迎接参加会商 ,请在这里颁发您的见解、互换您的概想 。

最新文章

热点文章

随机推荐

【网站地图】