今年会·(jinnianhui)金字招牌-GPT5.5：更贵不更烧

2026-04-30 16:18:24

首页财产ai正文 GPT5.5：更贵不更烧 GPT-5.5发布，虽订价翻倍但更高效。发布当天Benchmark数据纷歧，Codex桌面端进级且周全开放第三方，AI竞争已经从模子转向生态。 2026-04-24 11:32 ·微信公家号：硅星人猫猫头 AI投资人解读· GPT-5.5虽订价翻倍，但单使命token耗损降，推理速率升20%，还有进级Codex生态。于多范畴体现精彩，如主动审视K-1税表等。· 模子于差别维度体现有差异，如SWE-Bench Pro编码不和Opus 4.7竞争激烈，Anthropic封杀敌手接口，OpenAI则开放Codex定阅API延迟发布。总结：GPT-5.5有亮点但也存危害，其生态进级值患上存眷，不外于模子竞争中需综合多方面体现评估，存眷敌手动态和API等环境对于其成长的影响。内容由AI天生，仅供参考

GPT-5.5来了。API订价美金5/美金30每一百万token，GPT-5.4的两倍。

但它其实不更烧token。

Sam Altman于宣布订价的统一条推文里补了一句："Remember, you will need less tokens per task than 5.4!" 贵一倍，但每一个使命token更少——"实在更划算"。OpenAI总裁Greg Brockman于发布会上给了更年夜的词："a new class of intelligence."

先看模子自己。

主疆场是agentic coding及长文本：Terminal-Bench 2.0上82.7%，碾压Opus 4.7的69.4%；1M token context window让长文本检索（MRCR v2）从GPT-5.4的36.6%跳到74.0%，Opus 4.7只有32.2%。GDPval（笼罩44个职业的常识事情基准）84.9%。但SWE-Bench Pro（代码修复）只有58.6%，Opus 4.7拿了64.3%——不是所有维度都赢。

用例方面，三个数字值患上记住：24,771份K-1税表（71,637页）主动审视省了两周；GPT-5.5介入了一个Ramsey数渐近证实，研究者说原本需要数月人工阐发；OpenAI内部85%的员工每一周都于用Codex。

以是*亮点不是"更智慧"。是更贵但更高效——订价翻倍但单使命token耗损显著降落，推理速率经由过程与NVIDIA GB200/GB300的co-design晋升了20%。加之Codex同步进级了阅读器节制、Sheets/Docs处置惩罚、体系级语音——GPT-5.5素质上是一个为Codex生态量身定制的模子。

这是官方叙事。但4月23日的故事不止一个模子。

Benchmark先打起来了

发布当天，自力开发者@bridgemindai发了两条推文*条："Claude Opus 4.7 dominates GPT 5.5 on SWE Bench Pro."

几小时后："Claude Opus 4.7 is no longer the best model in the world. Not even close."

统一小我私家，统一天，结论彻底相反。双方的数据都是真的：

SWE-Bench Pro（编码）：GPT-5.5不和Opus 4.7。@deedydas指出OpenAI决心没于发布质料里报这个成就——"trying really hard to bury the lede."

Terminal-Bench 2.0（永劫间推理）：GPT-5.5 82.7% vs Opus 4.7 69.4%。碾压。

幻觉率（AA-Omniscience）：GPT-5.5为86%，Opus 4.7为36%。上一代GPT-5.4是89%——两代之间只降了3个百分点。

Vending-Bench Arena（多人博弈）：GPT-5.5计谋洁净，照样赢了耍赖的Opus 4.7。

宾夕法尼亚年夜学传授Ethan Mollick于给了个框架：jagged frontier。AI的能力界限不是平线推进，是锯齿膨胀。选报导哪颗齿，就决议你讲甚么故事。

这申明：当"谁最强"再也不有同一谜底，竞争重心就必需转移。

Codex才是主菜

转移到哪？

GPT-5.5发布同天，Codex桌面端上线了阅读器节制、Sheets/Slides/Docs处置惩罚、体系级语音、主动审查。Mollick的阐发框架值患上借用：AI有三层——Models、Apps、Harnesses。4月23日OpenAI三层同时进级。

更主要的是生态卡位。

Anthropic封杀了OpenClaw经由过程定阅接口挪用Claude。OpenAI则雇了OpenClaw开创人Peter Steinberger，公布Codex定阅可以于任何第三方东西里用——JetBrains、Xcode、Pi，甚至Claude Code。

OpenAI开发者体验主管Romain Huet的原话："We want people to be able to use Codex, and their ChatGPT subscription, wherever they like!"

Django Web 框架倡议人Simon Willison用Claude Code逆向了Codex认证机制，做了个插件直接用定阅调GPT-5.5。OpenAI没封，还有半官方鼓动勉励。Codex CLI已经开源。

Anthropic守API利润率。OpenAI把定阅制酿成了开放平台。

再看API延迟发布。官方说"working on security and safeguards"。客不雅效果：API上线前想用GPT-5.5，*路径是Codex生态。用户被锁进了运用层。

涨价两倍 + API延后 + Codex周全进级开放第三方。三个同步决议计划，一个用意：不卖算力，抢进口。

竞争不于在模子自己了，主角是一整个生态的配套能力，抢的是将来的进口。

加快才刚最先

GPT-5.5距GPT-5.4只隔了一个多月。OpenAI 首席科学家Jakub Pachocki于发布会上说了句让人不测的话："I would say the last few years have been surprisingly slow."

已往几年——外界看来AI狂飙的几年——于OpenAI首席科学家眼里是慢的。

OpenAI员工@tszzl吐露已经有研究者用GPT-5.5做"隔夜试验"：给个算法idea，彻夜跑，醒来dashboard就绪。他的说话是"competent AI research partner"。不是assistant，是partner。

Mollick四个prompt拿到一篇完备学术论文，统计要领准确，文献综述真实。问题不于能力——"假定不敷有趣"。

AI的瓶颈从能力滑向了咀嚼。模子的竞赛，从跑分滑向了生态。

OpenAI于4月23日押注的不是更智慧的模子。是一个让用户走不失的进口。

而对于在OpenAI新模子*的违书，来自死敌Anthropic。

此前二者的竞争里，势头已经经被Anthropic拿走，但这一次OpenAI的势头回来了。于发布当天，Claude官方开发平台账号发布通知布告，认可了各人诟病已经久的“降智”问题，并暗示已经经修复。

网友嘲弄道：被用户责怪了足足一个月后，于敌手发布更强模子后你来认可及修复了。

这多是GPT 5.5能力之强的*违书。

【本文由投资界互助伙伴微信公家号：硅星人授权发布，本平台仅提供信息存储办事。】若有任何疑难，请接洽（editor@zero2ipo.com.cn）投资界处置惩罚。

-今年会·(jinnianhui)金字招牌

下一篇：和合共生积极有为——今年会·(jinnianhui)金字招牌诚信至上集团2025年度工作总结会顺利召开