
Jay 发自 凹非寺镇江缓粘结预应力钢绞线
量子位 | 公众号 QbitAI
进犯发现:AI的自进化,开动了。
这是Anthropic刚刚在长文博客中,发表的暴论。
咱们的里面数据自满,Claude正在加快AI发展,这可能是条递归自我普及(RSI)的旅途。
并非「骇东谈主视听」,看了下著述,Anthropic是确凿实实地用数据在言语——
截止本年5月,80以上的Anthropic代码,都是Claude写的。
而在Claude Code发布之前,这个数字还仅是个位数。
与此同期,Anthropic工程师平均每季度请托的代码量,是2021-2025年的8倍。
进犯的是质地——
在盛开、磨叽、连谜底长什么样都不笃定的编程任务上,Claude的生着力现在是76,六个月前才26。
50个百分点的跳升。半年。
Anthropic里面还是有不少工程师合计,Claude写的代码质地和东谈主类平了。
瞻望年内会过。
Anthropic还强调,若是这个趋势陆续下去,AI我方谋划和构建下代AI,是可能的。
这可能改变社会,在医疗、科技、经济域带来雄壮的平正。但也可能让对皆问题调换恶化,终致失控。
因此,Anthropic带头敕令:
若是存在个可考据的机制,能保证AI实验室如实都没悄悄卷,咱们欢喜延缓、致使暂停。
除此以外,Anthropic的这篇博客里,还放出了蛮多有趣味的不雅点和事实。
以下是经过整理,便大阅读的版块。
Enjoy。Anthropic长文定调AI圈的摩尔定律来了
Anthropic创建了个全新的臆测维度,叫「AI能立完成的任务时长」。
2024年3月,Claude Opus 3能不停东谈主类巧合需要4分钟的软件任务。
年后,Claude Sonnet 3.7镇江缓粘结预应力钢绞线 ,1.5小时。
又年,Claude Opus 4.6,12小时。
而新的Mythos,在内测中的发扬是:
能一语气职责「至少」16小时,还是到了METR测试框架能臆测的上限了。
这个翻倍速率,从正本的每7个月翻倍,加快到了每4个月翻倍。
若是趋势不变,2027年,可能是好几周。
Claude编写了大部分Anthropic代码
戒指2026年5月,我Anthropic代码库的代码,过80由Claude编写。
在Claude Code发布前,这个数字直惟有个位数。
这种变化,也体现在工程师的职责式上。
在 Anthropic 的初四年,工程师每天Merge的代码行数基本保持不变。
2025年, Claude开动我方写代码,merge数已而开动飙升。
如今,2026年二季度,工程师每天merge的代码量是2024年的8倍。
不外,代码量上去了,代码质地是不是注水了?
Anthropic说,这年来,工程师创新Claude的次数,越来越少了。
这点,在benchmark中可见斑,如下图所示。
总共难度类型的任务中,Claude的生着力,例外的路暴增。
是以,Anthropic现在干脆用Claude来review代码。
是的,总共提交到代码库的篡改,都会先过遍Claude自动审查,查察bug、安全谬误和其他曲折。
他们回溯分析发现,若是之前每次篡改都有这谈自动审查,圣洁三分之致claude.ai线上事故的bug,上线之前就会被拦下来。
要知谈,写那些代码的工程师,还是是全寰球造AI系统顶的批东谈主了。
Claude在持他们的乖张。创造力的放大镜
接下来是Claude在决策层面的参与进度。
Anthropic有个旧例,每次发新模子,都会给Claude段查验微型AI模子的代码,让它在保证正确的前提下,把运行速率化到快。
2025年5月镇江缓粘结预应力钢绞线 ,预应力钢绞线Claude Opus 4交出的谜底是:加快3倍。
2026年4月,Claude Mythos Preview作念到了52倍。
行为参考,个熟习的东谈主类决策员,需要4到8个小时才能拼集达到4倍。
不到年的工夫,Claude过了东谈主类。
2026年4月,Anthropic丢给Claude个AI安全决策,玩忽是「个弱模子能不成可靠地监督个强模子」,然后让Claude我方提假定、跑实验……
这次先说东谈主类的发扬吧,两个东谈主类决策员花了圣洁周工夫,把gap减弱了23。
而Claude,在圣洁800小时、花了圣洁18000好意思元的算力之后——
减弱了97。
咱们何去何从?
到这里为止,论断还是很澄莹了。
东谈主类在AI斥地历程里的角,每个身手都在收窄。
代码,Claude写了。代码review,Claude作念了。实验实验,Claude快了东谈主类个数目。实验谋划,Claude开动我方来了……
东谈主类现在后的比拟势,是决策试吃和判断力。
但这个势能守多久?
Anthropic在博客里说,他们也不笃定。
种可能是,「决策试吃」就像之前AI不会的其他东西样,先是作念不到,然后已而就作念到了。
就像AI意会幽默、展示心智表面、解语言谜题,都履历了不异的弧线。
另种可能是,即便Claude始终学不会实在的决策试吃,仅靠现在的加快趋势,每个东谈主类决策员能同期迷惑的职责量还是大了好几倍。
你不需要AI替代你想考,它只消把总共「实验」的活全干了,你就只需要作念那5的向选拔。
RSI的三种畴前
博客拆伙,Anthropic刻画了对于这次「自进化」趋势三个可能演化向。
1、停滞。
那些指数弧线其实是S弧线。
也许决策判断力这个东西就是没法靠scale解决,需要种全新的架构打破。
或者,瓶颈在动力、在芯片、在算力的物理供应链上。
不外,即便AI的智力就停滞在今天的水平,也会发生对寰球带来首要变化。
前段工夫的Project Glasswing,Mythos Preview在上线头几周就发现了过万个危和严重别的软件谬误,遍布人人要害的系统。
2、AI陆续加快,但东谈主类仍然把着向盘。
组织率会指数普及,100东谈主的公司作念1万致使10万东谈主的活。知
Anthropic合计咱们巧合率正在走进这个场景。
但他们也发现了个有趣味的征象,就是阿姆达尔定律在组织里的体现_
Claude把代码写得速即了,着力代码review形成了新瓶颈。多样新认识、新器具、新实验爆炸式长远,远组织的消化智力。
瓶颈不会灭绝,仅仅抨击到下个身手。
3、AI兑现的递归自我普及,开动我方造下代我方。
这个场景下,AI的发展速率取决于算力了。东谈主类退到监督、考据、审核的位置。
若是确凿发生,这种智力巧合率会挪动到其他科学域,医学、材料、动力,全线升起。
诚然,另种畴前,是对皆失败。
这种情况下,偏差会在AI自我迭代的过程中慢慢积蓄,终——失控。OMT
以上,就是Anthropic这次对于自进化,要害的几个不雅点。
说真话,开动我其实没太当回事,毕竟Anthropic立时就要IPO了,这波不是典型的「Anthropic式」公关?
你别说,这次,可能确凿有点不样。
因为就在几天前,OpenAI也发布了肖似的博客:
咱们也在刻下系统中看到自进化的早期迹象: AI的发展自己也被AI加快。
咱们瞻望这将加重斥地商和国之间的竞争压力,并带来现存机构法搪塞的理挑战。
跟着RSI的出现,社会需要法塑造AI的发展轨迹 ,确保其管事于东谈主类利益。
奇点,似乎来得比总共东谈主意象的都要快。
博客:https://www.anthropic.com/institute/recursive-self-improvement
参考畅达:
[1]https://x.com/kimmonismus/status/2062517474277675102
[2]https://x.com/anthropicai/status/2062568873321513443
— 完 —
量子位 QbitAI · 头条号
温雅咱们,工夫获知前沿科技动态手机号码:13302071130相关词条:不锈钢保温施工 塑料管材生产线 钢绞线厂家 玻璃棉板 泡沫板橡塑板专用胶
1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定镇江缓粘结预应力钢绞线 ,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。