陵水预应力无粘结钢绞线刚刚, Karpathy惊呼「后AGI」! AI整夜狂改110次代码, 他去蒸桑拿

联系瑞通

联系瑞通

发布日期：2026-03-11 21:39:45 点击次数：103

新智元报说念

[新智元读]Karpathy让Agent整夜跑了110次践诺把模子练强后说了句「去桑拿了」，然后开源630行代码的autoresearch，块GPU就能领有个永不放工的AI连络践诺室——东说念主类连络员的新使命，是写好教唆词然后去蒸桑拿。

刚刚，Karpathy在x上发了条让通盘AI圈炸锅的帖子：

ahyes,thisiswhatpost-agifeelslike:)ididn'ttouchanything.brbsauna

啊对，这便是后AGI的嗅觉:)我什么王人没碰。先去蒸桑拿了。

什么样的时期冲突，能让这位AI大神如斯淡定地撂下句话就去蒸桑拿？

谜底是：他的AIAgent，在他睡眠的12个小时里，自主提交了110次代码变，把个话语模子的验证亏空（valloss）从0.862415路压到了0.858039——况兼莫得加多秒钟的测验时候。

炸裂的是，就在几天后，Karpathy把这套「AI我方搞科研」的法论包成了个仅630行代码的开源面容——autoresearch，扔到了GitHub上。

手机号码：15222026333

面容地址：https://github.com/karpathy/autoresearch

上线刚几个小时，就已冲到了3k星标！

Karpathy示意，任何东说念主只须有块GPU，就能在夜之间运行个AI连络践诺室。

这两件事叠在起，组成了幅前所未有的画面：AI不再仅仅东说念主类的用具，它运转我方化我方了。

而东说念主类连络员的新使命，酿成了——写份教唆词，然后去蒸桑拿。

nanochat

100好意思元训个ChatGPT

故事要从Karpathy的nanochat面容提及。

nanochat是Karpathy在2025年10月开源的个面容，标语极端炸裂——「100好意思元能测验的好的ChatGPT」。

nanochat面容地址：https://github.com/karpathy/nanochat

它用大致8000行干净的PyTorch代码，终显着个齐全的、从运转的话语模子测验活水线：分词、预测验、微调、强化学习、理、WebUI，条龙全包。

在个8块H100GPU的节点上，花4个小时傍边，你就能训出个不错跟你聊天的微型ChatGPT。

但nanochat真确让东说念主抖擞的地，不在于它有多低廉，而在于它有多「可迭代」。

通盘面容围绕个中枢参数——Transformer的度（depth）。

你只须拧这个旋钮陵水预应力无粘结钢绞线，其他总共参数（宽度、头数、学习率、测验时长、权重衰减……）王人会自动退换到有计划。

换句话说，这是个简但其精密的测验系统，适用来作念践诺。

昨天，nanochat取得了个里程碑式的施展：在单个8×H100节点上，仅用2小时就能训出GPT-2别才智的模子。

个月前这个数字如故3小时。

但真确的重头戏来了——Karpathy运转让AIAgent自动迭代nanochat的测验代码。

具体怎样玩的？

他给AI代理写了份大致120行的Markdown文档，极端于份「任务阐发书」，告诉AI：这个面容是干什么的，什么样的纠正算好的（验证亏空低），什么样的纠正弗成接受（测验时候变长、内存爆炸、代码变得太肥壮）。

然后，AIAgent就运转在个Git特分支上自主使命：读代码、想主意、改代码、跑测验、看效果。

要是果变好，就并到主分支；要是果变差或者测验变慢，就丢弃，再行来过。

效果呢？

12个小时，110次代码提交，d12模子的验证亏空从0.862降到了0.858，降了0.004——关于话语模子来说，这是个实着实在的杰出，况兼是在不加多任何测验时候的前提下取得的。

有个稀奇故理由的细节：其中有次提交，AI代理照实把valloss降下来了，但测验时候变长了，于是被系统自动拒了。

Karpathy设的法律诠释很严格——要么亏空，要么速率，要么两个王人，弗成拆西补东。

故理由的是Karpathy我方的反念念。

他说，在往常两周里，他花在「调AI代理的使命经过」上的时候，险些比他径直改nanochat代码的时候还多。

他迭代的不是代码自己，而是「让AI好地迭代代码的那套系统」——个「元化」的过程。

这意味着东说念主类连络员的角正在发生质变：从「亲手写代码作念践诺」，酿成了「联想个能让AI自动作念践诺的系统」。

Karpathy把这种嗅觉称为「后AGI（post-AGI）」。

天然，他我方也说这个说法半开打趣——今天的AI代理在终了想法面照旧极端蛮横，但在残酷创造的新想法面还差得远，咫尺接近于个自动化的参数调用具，而不是个真确的连络员。

但他紧接着说了句意味长的话：「跟着AI才智的提高，这条路的向是显着的——AI在自主纠正下代我方。」

autoresearch

630行代码，块GPU，5分钟轮践诺

要是说nanochat上的AI代理自动迭代是次「观念验证」，那么autoresearch便是Karpathy把这个观念包成了个东说念主东说念主可用的开源用具。

Karpathy适应开源了autoresearch面容。

他给这个面容写了段具科幻感的弁言：陵水预应力无粘结钢绞线

曾几何时，前沿AI连络还靠着群碳水化物有计划机——他们在吃饭睡眠摸鱼的弱点，偶尔通过组会庆典用声波相互吼两嗓子，就这样进着东说念主类的时期畛域。

阿谁年代照旧去不返。如今，连络被AI智能体接管……传说代码照旧迭代到了10205代，但这数字真伪已从验证——那些代码早已进化为能自我修改的二进制人命，远远出了东说念主类的领悟限度。

这个代码仓库，恰是这切故事的起初。

天然这段话写的是「来日愿景」，锚索但autoresearch面容自己的联想，照旧在适应地朝着这个向迈步。

autoresearch实质上是nanochat的「精简短机版」。

Karpathy把大模子测验的中枢代码压缩到了个约630行的Python单文献里，在单块GPU上就能跑。

通盘面容独一三个中枢文献：

prepare.py——数据准备：下载测验数据、测验BPE分词器，还有运行时需要的数据加载器和评估用具。这个文献是固定的，AI不会碰它。

train.py——测验代码：包含齐全的GPT模子界说、化器（Muon+AdamW）和测验轮回。从模子架构、参数、化器到批量大小，AI代理不错修改这里的切。

program.md——东说念主类写给AI的「指示书」：用天然话语形色连络标的和接续条目，东说念主类连络员通过剪辑这个文献来引AI的使命向。

面容的核神思制号称精妙——固定5分钟测验时长。

岂论你用的是什么GPU，岂论AI代理怎样改模子大小、批量大小、架构联想，每轮测验王人精准限制在5分钟。

这个联想有两个克己：，总共践诺效果径直可比，因为有计划预算是固定的；二，AI代容或自动为你的特定硬件找到成立。

你晚上睡8个小时，AI代理大致能跑100轮践诺。二天早上起来，你眼前摆着的是份详备的践诺日记，和个（梗概率）比昨晚好的模子。

通盘使命流被Karpathy详细为两句话：

AI代理在个Git特分支上自主轮回运行：改代码→测验5分钟→查抄分数→要是好就提交→要是差就回滚→络续改。

每个提交王人是次经过验证的纠正，像搭积木样层层往上垒。

而Karpathy为这个面容设定的终标的，说出来有点狂：联想出能够限期、需任何东说念主工干预、以快速率取得连络施展的AIAgent。

块GPU，个文献，个方针——这便是通盘践诺环境。

从「东说念主作念践诺」

到「东说念主联想作念践诺的AI」

传统的AI连络是这样的：个博士生（或者群博士生）猜想个idea，写代码终了，跑践诺，看效果，改参数，再跑，再看，极则必反。

Karpathy我方就说，这基本上是他通盘博士期间作念的事情。

个idea从残酷到验证，可能要花几天以致几周——因为东说念主要吃饭，要睡眠，要开组会，要跟师battle，要修bug修到怀疑东说念主生。

咫尺呢？

AI代理不吃饭不睡眠不摸鱼不恼恨，它24小时不停地跑践诺，5分钟轮，晚上100轮。

它不会因为相接跑了20次践诺王人失败了就心态崩了去刷外交媒体——它只会迁延地分析效果，退换政策，络续下轮。

天然，Karpathy我方也坦率地承认：AI咫尺相配擅长终了想法，但在残酷真确创造的新想法面还差得远。

autoresearch咫尺的使命式，像是个其吃力且不知困倦的「参数调工程师」，而不是个能残酷变革表面的连络员。

但要道在于——趋势是泄露的。

Karpathy说的那句话，险些不错行为这个期间的注脚：

AI在自主纠正下代的我方，东说念主类连络员偶尔往内部扔几个想法就行了。

这不是科幻，这是今天正在GitHub上开源运行的代码。

而autoresearch的开源，让这件事的门槛降到了令东说念主瞠宗旨进度。

咫尺，个立竖立者，块GPU，份全心写好的教唆词，就能在夜之间跑完个微型连络践诺室周的使命量。

这对通盘AI竖立生态的潜在影响是远的。

中小团队以致个东说念主竖立者，也能参与到模子测验和化的竞技场中。

AI研发的民主化，正在从赢得模子（开源权重）进到化模子（自动化践诺）。

端倪地看，autoresearch代表的是种新的「东说念主机配合范式」：东说念主类负责界说问题、设定接续、提供向的直观；AI负责在雄伟的搜索空间里不知困倦地试错和化。

东说念主类的创造力和AI的推论力，次以种系统化的式结在了起。

去蒸桑拿吧

寰宇正在被改写

回到Karpathy那条的帖子——「thisiswhatpost-agifeelslike,brbsauna」。

这句话的妙处在于，它既是句打趣，亦然个确切的信号。

当个AI域顶的连络者，能够定心性把模子化的使命交给AI代理，我方去蒸桑拿而不是在电脑前盯着测验日记——这自己就阐发了些刻的东西。

AI自主使命的才智照旧跨过了个临界点：它不仅能推论明确的指示，还能在个确切的、敞开的连络环境中，自主地发现纠正空间并付诸行动。

Karpathy为autoresearch写的那段弁言里有句话稀奇值得玩味——这个代码仓库，恰是这切故事的起初。

这不是异常，这仅仅收尾的运转。

AI代理在今天还仅仅个不知困倦的调参手。

但未来，当模子才智再上个台阶，当它们不仅能终了想法还能残酷想法的时候——阿谁Karpathy笔下「代码进化为自我修改的二进制人命」的科幻场景，偶然并莫得咱们想象的那么远方。

到当时候，也许咱们总共东说念主王人该去桑拿了。

你期待吗。

相关词条:离心玻璃棉塑料挤出机钢绞线厂家铝皮保温 pvc管道管件胶

1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定，并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方，并积极配合修改。
3.凡用户访问本网页，均表示默认详情页的描述，不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》，以此来变相勒索商家索要赔偿的违法恶意行为。

热点资讯

平凉预应力钢绞线价格特朗普宣布进入国紧

2026-01-15

平凉预应力钢绞线价格上海迪士尼将增增加

2026-01-19

平凉预应力钢绞线价格四强敌手！越南本届

2026-01-27

平凉预应力钢绞线价格九江长安欧尚长安欧

2026-01-15

平凉预应力钢绞线价格力资源社会保障部办

2026-01-12