今年会·(jinnianhui)金字招牌-刚刚，GPT

2026-04-30 16:18:23

首页财产ai正文方才，GPT-5.5发布！更强更快更贵 GPT-5.5降临，与英伟达结合设计，于多范畴晋升显著，打破“更强更慢”铁律，效率更高，还有能优化自身，OpenAI估计模子发布数据将加速。 2026-04-24 11:03 ·微信公家号：量子位存眷前沿科技 AI投资人解读· GPT-5.5与英伟达结合设计，于代码、常识事情、科学研究范畴上风较着，效率更高且功效强盛，还有打破模子进级“更强更慢”的铁律。· 行业竞争加重可能影响其市场份额模子自身优化可能带来新危害。总结：GPT-5.5依附技能上风及机能晋升具有投资潜力，但需存眷竞争与自身优化带来的危害，建议联合行业成长趋向综合评估。内容由AI天生，仅供参考

GPT-5.5，方才降临。

官方定位，“一种面向现实事情及智能体的新型智能。

此次奥特曼没有本身站出来讲“初体验被吓到眩晕瘫坐，那一刻就像看到原枪弹爆炸”了，而是请了一群嘴替（初期测试用户）。

此中有一名英伟达工程师，他于初期测试竣事后短暂的掉去了GPT-5.5的拜候权限，然后说了如许一句话：

掉去GPT-5.5，就像被截肢。

说归说，闹归闹。

OpenAI与英伟达此次的互助是史无前例的。

*，GPT-5.5及英伟达GB200、GB300 NVL72体系是结合设计的，练习到部署，模子及硬件之间从降生最先就双向奔赴。

第二，推广Codex到英伟达全公司，奥特曼还有晒出了与老黄的邮件。

互助的结果，先来看数据。

与上个版本GPT5.4比拟，新模子于代码、常识事情、科学研究三个范畴全数拉开身位。

综合测试Artificial Analysis Intelligence Index成果，有两种解读方式：

GPT-5.5得到不异的分数比Claude Opus 4.7及其他模子耗损token更少。

或者者耗损一样的token，GPT-5.5完成的使命更多。

但最使人不测的不是跑分。

已往每一一次模子进级，“更强”及“更慢”险些是打包出售的。

这是Scaling Law的价钱，更年夜的模子，更多的参数，更长的思索时间。用户为智能买单的同时也于为延迟买单。

GPT-5.5打破了这条铁律。

于真实出产情况中，它的逐token延迟及GPT-5.4相称，完成不异使命需要的token还有比GPT5.4少了。

效率更高，功效更强盛。

（但价格翻倍）

截至发稿，Codex更新最新版已经经能用上GPT-5.5。

上下文窗口也进级到400K

给编程开挂

编程是GPT-5.5晋升最猛的范畴。

上一代模子用起来，还有是患上不寒而栗地拆使命，一步步看着它走，随时预备纠偏。

GPT-5.5纷歧样了。你把需求丢已往，它本身拆解、本身履行、本身查抄。你只需要看成果。

OpenAI展示了Codex下GPT-5.5天生的3D动作游戏，于网页上直接运行。

包括用TypeScript/Three.js实现战斗体系、仇敌遭受、HUD反馈以和GPT天生的情况纹理。

Terminal-Bench 2.0，权衡繁杂号令行事情流的硬核测试，GPT-5.5拿到82.7%。

上一个版本本的GPT-5.4是75.1%，今朝最强竞品Claude Opus 4.7是69.4%。

可以理解为：遇到这类级另外难题，上一代模子快要三分之一会卡住，此刻这个比例压到了四分之一如下。

接下来请各路嘴替：

初期测试者Dan Shipper做了一个试验。他是草创公司CEO，同时也是一名活跃的AI产物开发者。

他的App上线后出了一个bug，请了一名*工程师来重构。工程师花了一番功夫，终极给出了一个解决方案。

然后Shipper把时钟拨归去：把那段有bug的代码丢给模子，看它能不克不及自力做出及那位工程师同样的决议计划。

GPT-5.4做不到。GPT-5.5做到了。

Shipper说，这是他*次于一个编程模子身上感触感染到真实的“观点清楚度”。

不是接话，是理解了问题以后本身想大白怎样解决。

愈来愈多高级工程师于反馈统一件事：GPT-5.5于推理及自立性上较着强在GPT-5.4及Claude Opus 4.7。

它可以或许提早发明问题，并于无需明确提醒的环境下猜测测试及审查需求。

编程只是最先。一样的能力跃迁，正于向常识事情及科学研究两个标的目的扩散。

编程以外

GPT-5.5于Codex里干的事，远不止写步伐。天生文档、收拾表格、做PPT。

OpenAI屡次夸大，它比上一代更懂你想要甚么。

更要害的是，它会本身用东西、本身查抄输出对于不合错误。你给一个恍惚的设法，它能帮你补完剩下的。

这里有个数据颇有意思，OpenAI本身跨越85%的员工，每一周都于用Codex干活。（别的15%是怎么回事？）

还有是先看评测成果。

于常识事情基准测试GDPval上，GPT-5.5拿到84.9%，比Claude Opus 4.7超出跨越4.6个百分点。

FrontierMath Tier 4，今朝最难的数学基准之一，标题问题来自未发表的论文及*研究者的开放问题。

GPT-5.5 Pro于这个测试上拿下了39.6%。Claude Opus 4.7是22.9%，差距靠近一倍了。

真正成心思的是科学家们怎么用它。

Bartosz Naskręcki是波兰亚当·密茨凯维奇年夜学的数学助理传授。他给Codex写了一句话，11分钟后，一个代数几何可视化运用就跑起来了。

这个运用能画出两个二次曲面的交线，标成红色，还有能用Riemann-Roch定理把交线转成Weierstrass曲线的尺度情势。厥后他又扩大了更不变的奇点可视化功效。

一句话，11分钟。搁之前，光是搭项目框架就患上半天。

Derya Unutmaz是杰克逊基因组医学试验室的免疫学传授。他用GPT-5.5 Pro阐发了一份基因表达数据集：62个样本，快要28000个基因。末了产出了一份完备的研究陈诉。

他说，这原来要花团队几个月的时间。

OpenAI对于GPT-5.5于科研中的定位，有一句话归纳综合患上很准，它再也不像一次性谜底引擎，更像一个”研究伙伴”。

初期测试者拿它做的不只是查资料。多轮修正论文，逐条挑论证的缝隙，提出新的阐发方案。它记住了你整个研究脉络，每一一轮对于话都成立于前一轮的基础上。

GPT-5.5于数学范畴做了一件年夜事。

Ramsey数，组合数学里最焦点的问题之一。

通俗地说，它研究的是：一个收集要年夜到甚么水平，才能包管某种秩序一定呈现？

好比，六小我私家里必然有三小我私家互相熟悉，或者者三小我私家互相不熟悉，这就是最简朴的Ramsey定理。

它是数学界几十年的硬骨头，off-diagonal Ramsey数的渐近性子，更是持久悬而未决。

GPT-5.5找到了一个新的证实路径。不是复现已经知要领，而是发明了一条新路。随后，这个证实被数学界最严酷的情势化验证东西之一Lean确认无误。

一个AI，于纯数学的焦点范畴，做出了被情势化东西验证的原创孝敬。

一年前，这还有不成想象。

更强却不更快的奥秘

“更强却更快”是怎么做到的？

谜底不是于某一个环节上做了优化。OpenAI把整个推理体系推倒重来了。

前面提到GPT-5.5及英伟达GB200、GB300 NVL72体系是结合设计的，成果于划一延迟下，智能程度年夜幅跃升。

但还有有另外一个故事。

GPT-5.5驱动的Codex体系，阐发了数周的出产流量数据，然后写出了一个负载平衡的分区开导式算法。

以前，哀求被切分成固定命量的块，分发给加快器处置惩罚。但固定的分块计谋于差别流量模式下其实不老是*。有时辰块分患上太粗，有时辰太细，资源使用率忽高忽低。

Codex看了几周的真实流量数据，本身写了一套自顺应的分区算法。按照现实流量形态动态调解分块计谋。

token天生速率晋升了跨越20%。

模子优化了运行本身的基础举措措施，AI于让本身跑患上更快。

推理体系的总体重构，加之模子介入自身的优化，两件事叠于一路，带来了如许的成果。

OpenAI说，这是“迈向用计较机完成事情的新方式的一步”。

但当模子已经经最先优化本身运行的基础举措措施——

这一步，到底迈了多远？

One More Thing

有了GPT-5.5，OpenAI估计接下来模子发布数据将加速。

咱们看到短时间内有相称显著的前进，中期有极为显著的前进。

我认为已往几年进展出乎意料地迟缓。

说这话的是首席科学家Jakub Pachocki ，场所是与记者的德律风集会上。

参考链接：[1]https://openai.com/index/introducing-gpt-5-5/[2]https://x.com/firstadopter/status/2047378435555651856?s=20

【本文由投资界互助伙伴微信公家号：量子位授权发布，本平台仅提供信息存储办事。】若有任何疑难，请接洽（editor@zero2ipo.com.cn）投资界处置惩罚。

-今年会·(jinnianhui)金字招牌

下一篇：和合共生积极有为——今年会·(jinnianhui)金字招牌诚信至上集团2025年度工作总结会顺利召开