起源:中国工程院院士陈毓川归天作者: 黄
上市紧要关头,大神卡帕西加盟Anthropic
2026年最重要的人事改观之一,莫过于安德鲁·卡帕西(Andrej Karpathy)去了Anthropic。
就在2025年5月19日晚,卡帕西发了一条X,称他现已入职Anthropic,重新投身研发工作。
卡帕西是OpenAI的结合首创人之一,也曾辅导特斯拉的自动驾驶团队。
这个新闻之所以炸裂,不单单是说卡帕西的身份显赫,关键是他参与Anthropic的机遇。
Anthropic打算在2026年下半年上市,此刻正是必要行业顶级人才背书的时刻。
而卡帕西,刚好就是这么一个行业支柱,绝对的灯塔级人物。
他的参与,势必会让Anthropic如虎添翼。
不但是如此,卡帕西在Anthropic干的活也是极度有意思,他要让Claude自己来钻研自己,自己去提升自己。
卡帕西参与Anthropic做什么?
卡帕西参与的是Anthropic的预训练团队,但他干的可不是通常预训练的活儿。
Anthropic预训练掌管人尼古拉斯·约瑟夫(Nicholas “Nick” Joseph)转了卡帕西参与的这条X,并写到,卡帕西将组建一支团队,专一于使用Claude大模型,来推动预训练有关钻研工作。
预训练的性质是让大模型对事物有基础的认知,就像咱们口中的学问一样,下雨要打伞、出门带钥匙。
后面的微调、RLHF、安全对齐、产品化,都成立在这个底座之上。
而卡帕西要做的,是让模型参加到预训练这个过程中,让AI钻研AI自己。
这里可能有点绕,我尽量把它诠释明显。预训练是一个阶段,而在这个阶段里,模型必要进行屡次大规模训练。
第一次大规模训练的时辰,团队可能尝试某个架构和数据配比,而后凭据训练的了局发显熹中的问题,调整第二次大规模训练规划,而后再优化、再训练,一向往复。
钻研团队在这个过程中必要做无数个决策,好比用什么数据、怎么洗濯、怎么配比、用什么架构、怎么调超参数、训练过程中出问题了怎么办等等。
一个模型跑了几周的大规模训练,了局发现一路头的方向错了,那这几周的算力和功夫就全数浪费了。
所以若是能在训练前,通过AI的辅助钻研,排除掉一部门谬误的方向,那么模型的训练效能就会更高。
那为什么这事得卡帕西来呢?
其实是由于卡帕西的身份很特殊,他的经历席卷钻研员、工程师和产品经理三大板块。
他在OpenAI工作过两次,第一次是2015年作为结合首创人参与,担任钻研科学家,专一于深度进建和推算机视觉,直到2017年脱离参与特斯拉。
第二次是2023年回归OpenAI,参加GPT-4的改进工作,直到2024年再次脱离,创办了Eureka Labs。
2017年的时辰,马斯克亲自礼聘卡帕西,让他辅导特斯拉的推算机视觉工作?ㄅ廖髡乒芴厮估娜远菔缓虯utopilot项目,直到2022年脱离。
这些工作让卡帕西对大规模工程化这件事,有了更深刻的理解。
就拿特斯拉来说,你要把自动驾驶部署到百万辆车上;贡匾茉谡媸凳澜缰泄ぷ鳌⒁χ酶骼嗉饲榭觥⒁谟邢薜乃懔凸南略诵,没点工程伎俩底子拿不下来。
好多AI钻研者只会做尝试,发论文,但不知路怎么把模型造成产品?ㄅ廖魇羌榷瓵I,也懂工程,还懂产品。
所以Anthropic的这个岗位,非卡帕西莫属。
换一种思路,卡帕西的参与对Anthropic来说,也是一次重大成功。
Anthropic打算在2026年上市。技术和产品固然也很重要,但华尔街底子看不懂大模型,他们只看得领略你们企业有什么样的人物。
卡帕西在AI行业内显然是个图腾一样的存在。
不但是AI圈,他在教育圈也是大佬。
2015年,卡帕西和李飞飞一路设计了斯坦福大学第一门专门讲授深度进建的课程,他是重要讲师。这门课的视频网上旁观次数超过了80万次。
近年来,他在YouTube上颁布了大量技术解说视频,教人们若何从零起头构建如同GPT那样的大说话模型。讲授风格清澈,对问题深刻浅出,能把最复杂的技术问题讲得让通常人也能理解。
在Anthropic组建反OpenAI同盟
随着卡帕西的参与,Anthropic的OpenAI diaspora同盟变得越发壮大了。
这是表网发现的一个极度谐谑的叫法,diaspora这个词的原意是“离散群体、散居群体”。
放在OpenAI diaspora这个词里,指的就是那些已经在OpenAI工作,后来脱离OpenAI,到Anthropic里的人。
Anthropic的两位结合首创人阿莫迪兄妹,他俩都是OpenAI的前高管。达里奥曾是OpenAI的钻研副总裁,丹妮拉曾是OpenAI的副总裁。
除此以表还有汤姆·布朗(Tom Brown),他是GPT-3论文的第一作者。此刻的汤姆是Anthropic的钻研副总裁。
还有克里斯·奥拉(Chris Olah),现任Anthropic可诠释性钻研掌管人。
他在OpenAI工作期间,开创了神经网络可诠释性的多个重要方向。别人训练模型只看了局好不好,克里斯想知路AI到底是怎么工作,大模型思虑的时辰,到底是哪一层神经元在起作用。
还有杰拉德·卡普兰(Jared Kaplan),scaling laws的重要钻研者之一。
Scaling laws现如今早已是尽人皆知,讲的是扩大算力规模,模型能力就会持续提升。
还有山姆·麦克坎迪许(Sam McCandlish),同样是scaling laws的重要贡献者,也是GPT-3训练的关键人物,此刻是Anthropic的钻研科学家。
为什么这些人会脱离OpenAI?
理由也是多说纷繁。阿莫迪兄妹在脱离OpenAI时暗示,他们对OpenAI的方向有分歧见解,尤其是在AI安全方面。他们以为OpenAI过于关注贸易化,而对安全钻研投入不够。
所以他们创办Anthropic,但愿成立一个更关注安全的AI公司。
表媒还流传着这样一种说法,是OpenAI在2019年转型为投机性公司后,整个公司的文化和优先级都发生了变动。
OpenAI的高层们起头思考收入、利润、估值和股东回报,对一些早期成员来说,这种转变是难以接受的。
这不是说贸易化自身是错的。
但对那些更关切钻研和安全的人来说,他们开发产品还必要对市场和客户掌管,这件事背离了他们做钻研的初心。
所以他们脱离了,创办了Anthropic。
Anthropic一路头就说自己是公益公司(PBC),这个身份在司法上就跟通常公司不一样。
通常公司的董事会只对股东掌管,赢利就行。公益公司的董事会得同时思考公共利益,每年还要出汇报,说自己为社会做了什么。若是光顾着赢利不论公益,股东能够告你。
但光有这个身份还不够,Anthropic还搞了一套更狠的机造,接装持久利益信任基金”(LTBT)。
单一说就是,公司之表专门设了一个独立机构,由五幼我组成,这五幼我必须是AI安全、国度安全、公共政策这些领域的专家。
他们手里握着一类特殊的T类股票,在极端情况下,好比AI可能造成苦难性风险的时辰,这五幼我能够否决董事会的决定,强造公司把安全放在第一位。
就算投资人和治理层都想冒险赚快钱,这五个表部专家能够一票否决。
卡帕西的参与,给整个团队带来的是一种强烈的认同感。
“咱哥几个,已经既然能在OpenAI创造了GPT的事业,此刻我们到了Anthropic,照样能再创鲜丽!”
我对比了一下2015年OpenAI的缔造布告,发现了一个很有意思的事件。由于卡帕西参与了Anthropic,导致此刻Anthropic里的OpenAI首创团队人数,已经和OpenAI打平了。
OpenAI这边有奥特曼、布鲁克曼和沃伊切赫·扎伦巴(Wojciech Zaremba),Anthropic有德克·金马(Durk Kingma)、卡帕西,还有已经去职的约翰·舒尔曼(John Schulman)。
不外,这不是说Anthropic否决OpenAI的技术路线。事实刚好相反,Anthropic的技术路线和OpenAI极度类似,都是基于大规模说话模型,都相信scaling laws,都在钻营AGI。
Anthropic否决的,是OpenAI的贸易化优先战术,以及OpenAI在安全钻研上的不及。
能够注定的是,在AI编程和ToB这两个领域,Anthropic当先OpenAI太多了,以至于Codex明明履历下来要比Cowork更好,但各人依然会选Anthropic的产品。
更重要的是,卡帕西还给Anthropic带来了名人效应。
谁会不想跟卡帕西这样的行业图腾共事呢?
@徐秀真:青青草app成人看片软件,郑丽文回故里现身“云林人之夜”@李宗宪:昭通部门停车场鉴别不出“粤AP”车牌
@林秀绮:金巧巧分享带娃日常
热点排行
- 1 忍者注入器
- 2 馃拫XXXXATU馃拫HD18
- 3 嗖九九的宝藏扣聆
- 4 欧美性爱TV
- 5 99ri.50
- 6 草莓视频在线看污
- 7 特色大片
- 8 18 无套直番茄视频
- 9 海南妇搡BBBB搡BBBB