2026世界杯指数 Opus4.8刚发布, 立马被拆台: 跑分赢了GPT-5.5, 但编码王座不稳了

来源:开云2026世界杯官方授权平台 作者: 发布时间: 浏览:57

2026世界杯指数 Opus4.8刚发布, 立马被拆台: 跑分赢了GPT-5.5, 但编码王座不稳了

AI圈炸锅了!Anthropic夜深扔出的Opus4.8,基准测试把GPT5.5踩在眼下,但培植者却集体吐槽:这数据和骨子用起来彻底不是一趟事?

此次升级,Anthropic给培植者塞了两个“硬菜”

5月28昼夜深,Anthropic暗暗发布了Opus4.8,此次不是只拼跑分,而是径直对准培植者的责任流,dynamic workflows和更低廉的fast mode。

dynamic workflows险些是培植者的“超等助手”:它能让Claude写剧本转圜上百个小AI(subagents)并行干活,最多一次能跑1000个,并发上限16个。最绝的是,这些小AI在后台忙的手艺,你和Claude的对话还能不绝,不会卡住。比如Jarred Sumner用它把Bun从Zig迁到Rust,75万行代码,11天就处理,还通过了99.8%的测试!

fast mode更真的:速率是平庸样貌的2.5倍,价钱却砍到原本的三分之一,当今每百万输入token10好意思元,输出50好意思元,比4.7版块低廉太多。对那些追求速率和隐约量的场景来说,这但是真金白银的省。

除了快和低廉,Opus4.8还思作念“本分的AI”

AI圈当今卷的不仅仅能力,还有“东说念主品”。Opus4.8此次要点吹的是“更本分”:糊弄率比前代权贵镌汰,2026世界杯亚盘协作奢华肯求的比例也更少,致使对我方写的代码劣势目大不睹的概率低了四倍。

Anthropic说它在“亲社会特色”上创了新高,比如更救助用户自主性,按用户最好利益行事。轻便说,过去AI可能错了也不说,当今会主动指出风险,致使领导你那里不合。这对需要靠谱判断的培植者来说,险些是枯木逢春。

基准测试打了GPT5.5?但培植者不买账

开云中国2026世界杯手机app在线入口

Anthropic放出的基准数据很亮眼:Opus4.8在agentic coding上拿了69.2%,特出GPT5.5的58.65%和Gemini3.1 Pro的54.2%。但在terminal coding上,仍是输给了GPT5.5,差3.6个点。

可培植者社区却不买账。Redis作家antirez径直月旦Anthropic犯了“首要计谋造作”:明明好多东说念主认为GPT5.5的编码体感更好,你却拿基准数传说我方更强,这不是让用户困惑吗?DHH也在X上夸GPT5.5:“用了这样多模子,只消它让我反复惊奇‘怎么这样好’。”

网友Chubby更是径直点破:“Opus4.8很强,但Anthropic当今更像在追OpenAI,而不是引颈节拍。”

Opus这一年:从“编码之王”到争议不断

旧年5月Opus4刚发布时,Anthropic喊它“寰宇最好的编码模子”,照真的长高下文和agent任务上让东说念主目下一亮。但这一年走来,争议不断:4.6版块的长高下文订价坑:特出20万token就按更高价算,被用户骂变相加价;4.7版人性能着落,还针锋相对,Anthropic我方齐承认不如其时的Mythos Preview;最近Agent SDK拆分计费,又让民风救助额度的用户不悦。

2026世界杯指数