milan 刚刚，GPT-5.5 发布！Claude Code 连夜治好降智，「奥特曼瘫倒」喜提续集

发布日期：2026-04-24 16:11 点击次数：125

据外媒 Business Insider 报谈，Anthropic 在私募二级市集的估值已冲破 1 万亿好意思元。看成参照，OpenAI 本年 3 月末最新一轮融资的估值，仍停留在 8520 亿好意思元。

除了业内须生常谭的「AI 泡沫论」，这组对比数据也标明了也曾稳坐头把交椅的 OpenAI，如今正在直面被追逐、被超越的压力，但莫得让咱们恭候多久，OpenAI 的反击眨眼间而至。

就在刚刚，GPT-5.5 雅致发布，同步亮相的还有面向更高阶任务的 GPT-5.5 Pro 版块。

若是用一句话回来 GPT-5.5 的中枢盘算念念路，那就是让用户把一团絮叨、多设施的复杂任务顺利抛给模子，由它自主标的旅途、调用器具、校验驱散、消解歧义，并一起鼓舞。

看似仅仅 0.1 的版块号迭代，在推理后果上却判若大版块更新—— 相似的 Codex 任务，GPT-5.5 破钞的 token 显赫更少，既更贤慧，也更省。

▲吐槽了一个多月，偏巧比及 GPT-5.5 发布，Anthropic 才想起要措置降智问题

GPT-5.5 登场，不讲武德的屠榜

GPT-5.5 的纸面成绩终点可不雅。

在驰名第三方评测机构 Artificial Analysis 的概述智能指数榜单上，OpenAI 凭借 GPT-5.5 系列拿下了第又名和第二名，前六席中包揽了四席，竞争敌手险些毫无抵触之力。

基准测试驱散披露，在 Terminal-Bench 2.0（测试复杂号召行责任流）上，GPT-5.5 达到 82.7%，GPT-5.4 为 75.1%，Claude Opus 4.7 为 69.4%。

在 SWE-Bench Pro（评估着实 GitHub 问题措置才智）上，GPT-5.5 达到 58.6%，能在单次运行中端到端完成更多任务，高出 GPT-5.4 的 57.7%。

在 OpenAI 里面的 Expert-SWE 评测上，任务的东谈主类瞻望完成时期中位数为 20 小时，GPT-5.5 达到 73.1%，GPT-5.4 为 68.5%。且在三项评测上，GPT-5.5 均以更少 token 完成任务。

只不外，OpenAI 此次也玩起了脚注里的小心念念，用一排小字暗戳戳质疑 Claude Opus 4.7 部分红绩的着实度。但网友 Deedy 对此并不买账，在他看来，这行备注更像是升沉细心力 —— 毕竟 OpenAI 我方也没能拿出一套更透明的公开基准，正面佐证 GPT-5.5 的实力。

在智能体编码、computer use（酌量机使用）、学问责任和早期科学盘问等限制，GPT-5.5 的普及尤为显赫。

早期测试者响应，GPT-5.5 在邻接大型代码库举座结构方面显着更强，能主动预判潜在问题，提前接洽测试和审查需求，无需特地指示。

驰名评测博主、Every 独创东谈主 Dan Shipper 共享了一个具体案例：他的应用上线后出现问题，我方调试数天未果，最终请来工程师重写了部分系统。他用 GPT-5.5 重现这一场景，驱散模子给出了与工程师相通的措置念念路，而 GPT-5.4 则窝囊为力。

Cursor 连结独创东谈主 Michael Truell 暗示，GPT-5.5 比 GPT-5.4 更贤慧、更有韧性，器具调用更可靠，濒临复杂永久任务时能坚捏更久而不半途停驻。

更夸张的是，博亚体育app官方网站一位英伟达工程师在早期体验后直言：「失去 GPT-5.5 的探访权限，嗅觉就像是我的肢体被截肢了一样。」

▲ 如无未必，又一个名梗的出生

（哈？？）不外，接洽到奥特曼看完 GPT-5 演示之后，顺利「晕厥无力、瘫倒在地」，而且这件事到今天也莫得一个端庄讲明，英伟达工程师这句话，大要也没那么夸张了。

而在学问责任场景，GPT-5.5 也有着出色的推崇。

在算计模子横跨 44 种干事学问责任才智的 GDPval 评测中，GPT-5.5 告成或打平比例达 84.9%，GPT-5.4 为 83.0%，Claude Opus 4.7 为 80.3%，Gemini 3.1 Pro 仅 67.3%。在 OSWorld-Verified（测试模子能否自主操作着实酌量机环境）上，GPT-5.5 达到 78.7%，GPT-5.4 为 75.0%，Claude Opus 4.7 为 78.0%。在 Tau2-bench Telecom（测试复杂客服责任流）上，GPT-5.5 在无指示词调遣的情况下达到 98.0%，GPT-5.4 为 92.8%，差距相配显着。在其他专项评测上，GPT-5.5 在 FinanceAgent v1.1 达到 60.0%，里面投行建模任务达到 88.5%，OfficeQA Pro 达到 54.1%（Claude Opus 4.7 为 43.6%，Gemini 3.1 Pro 仅为 18.1%）。在 BixBench（围绕着实生物信息学和数据分析盘算）上，GPT-5.5 达到 80.5%，GPT-5.4 为 74.0%，米兰体育官网在已发布分数的模子中名轮换一。在 GeneBench（测试遗传学和定量生物学的多阶段数据分析）上，GPT-5.5 达到 25.0%，GPT-5.4 为 19.0%，Pro 版块达到 33.2%。这些任务鄙俚对应科学巨匠数天的责任量。

OpenAI 里面有高出 85% 的职工每周使用 Codex，遮掩软件工程、财务、传播、市集、数据科学和家具连接等部门。

财务团队用 GPT-5.5 审查了 24771 份 K-1 税务文献，合计 71637 页，最终比上一年提前两周完成。传播团队打造了一套自动化 Slack 机器东谈主，负责处理低风险恳求自动处理，市集团队的又名职工则用它自动生成每周业务评释，每周从简 5 到 10 小时。

此外，GPT-5.5 的一大亮点还在于推理基础设施的协同升级。

GPT-5.5 与 NVIDIA GB200 和 GB300 NVL72 系统连结盘算和检修。其中一项要津更恰是负载平衡和分区策略，Codex 分析了数周的出产流量数据，编写了自界说启发式算法来动态优化分区和负载平衡，最终将 token 生成速率普及了高出 20%。

OpenAI 还指出，GPT-5.5 自身也参与了改动自身推理基础设施的历程。

GPT-5.5 即日起向 ChatGPT Plus、Pro、Business、Enterprise 用户开放，Codex 相沿最高 400K 高下文窗口，并提供 1.5 倍速的 Fast 花式（用度为程序价钱的 2.5 倍）。GPT-5.5 Pro 则面向 ChatGPT 的 Pro、Business 和 Enterprise 用户推出。

API 版块行将上线，程序订价为每百万输入 token 5 好意思元、每百万输出 token 30 好意思元，高下文窗口为 1M token。批量处理和弹性订价为程序价钱的一半，优先处理花式为程序价钱的 2.5 倍。

GPT-5.5 Pro 的 API 订价为每百万输入 token 30 好意思元、每百万输出 token 180 好意思元。OpenAI 暗示，由于 token 后果的普及，大多量用户的本体使用老本不会有显着增多。缄口不提 Claude Opus 4.7，却句句王人在内涵。

OpenAI 要作念 AI 期间的超等进口

莫得哪一款模子能收货一边倒的评价，GPT-5.5 相似如斯。网友 @chetaslua 用一条指示词在 Codex 中生成了一个带有风效应物理引擎的好意思满网站，物理交互和界面盘算一并到位，嘉赞「这是我第一次以为 ChatGPT 不错成为措置一切问题的首选 AI 器具」。

网友 @petergostev 让模子生成了一个包含伦敦地标和季节变化的玩物铁路场景，与 GPT-5.4 的输出对比后，他的论断是「GPT-5.5 更有贪心、一致性更强，漏洞更少」，并在更复杂的应用迁徙任务中让模子一语气责任数小时，莫得出现卡壳。

固然，吐槽的声息相似存在。网友 @arrakis_ai 发现，GPT-5.5 在际遇复杂布局时有时会顺利生成一张图片了事，处理图标需求时会从新硬写 SVG 而不调用现成库，同期鄙俚暂停追问用户，现实力反而不如从前轻薄。

文笔方面，我的个东谈主体验也有访佛感受。GPT-5.5 确乎比前代更会组织言语了，至少也曾能说点东谈主话，但依然有一股怪味：「我就在这里，不躲，不藏，不绕，不逃，稳稳地接住你」。

而况，不少网友也细心到，OpenAI 在基准测试榜单上也动了些营销的心念念。

网友 Haider 认为，GPT-5.5 和 Mythos 的差距莫得预感的那么悬殊，而 Mythos 订价是 GPT-5.5 的两倍，且不公配置售。他的判断是，下一代 GPT 赶上 Mythos 应该问题不大。

据外媒 Techcrunch 报谈，濒临记者对于「GPT-5.5 是否具备访佛 Mythos 才智」的刺探时，OpenAI 手艺东谈主员 Mia Glaese 给出了一个点水不漏却遁藏矛头的回话：「咱们在集结安全方面有着永久且强有劲的战术，而况也曾完善了一套捏久的、安全推出模子的方法。」

话外之音也曾十分清明：单一的广博模子终究仅仅过客。真到了拼数字预防和企业级落地的深水区，OpenAI 的生态壁垒，才是 B 端客户独一适应的安全牌。

而跟着 GPT-5.5 的登场，OpenAI 的贪心也曾阔气廓清：他们不再情愿于作念一个贤慧的聊天机器东谈主，而是要亲手打造一个吞吃一切责任流的「AI 超等应用（Super app）」。

在袭取外媒采访时，OpenAI 总裁 Greg Brockman 用了一个词「自主性（Agentic）」来刻画此次模子的越过跨越。与前代模子 GPT-5.4 版块比较，GPT-5.5 破钞的 Token 更少，但念念考速率更快、逻辑更廓清，运行展现出主动措置复杂问题的才智。

这恰是迈向超等应用的坚实底座。

▲ 奥特曼今晚荒谬振作，还更换头像了

所谓超等应用，即是将 ChatGPT、Codex 与 AI 浏览器深度和会为拯救干事。假想改日的责任流：东谈主们毋庸再在浏览器、代码裁剪器、数据分析器具之间反复切换。只需对着这个超等应用下达一个宏不雅指示，GPT-5.5 就能自主在后台怒放网页征集府上、编写爬虫代码、清洗数据，最终顺利委派一份好意思满的分析评释。

固然，犹如 Claude 与 Claude Code 的强绑定，OpenAI 也意在替 Codex 的增长势头加一把火。最近，奥特曼暗示，Codex 活跃用户在冲破 300 万不到两周后便直逼 400 万大关，OpenAI 随之重置速率摈弃，以「量大管饱」的姿态收割配置者生态。

一方面，凭借 GPT-5.5 与 GPT-Image-2 的强势推崇，正面顽抗了 Anthropic 在估值预期上的压力；另一方面，则诈欺 Codex 的生态粘性紧锁配置者阵脚，稳步构筑起横跨 C 端消费与 B 端企业级干事的好意思满干事体系。

攻守之势异也，本年以来被诟病掉队的 OpenAI，终于再行找回两年前的遑急节律，并将元气心灵放在了循途守辙打磨家具上。

附上 OpenAI 官方博客地址：

https://openai.com/index/introducing-gpt-5-5/

*封面由 AI 生成

星空体育中国官网入口

上一篇：米兰体育官网肩前痛总不好？可能是这 3 块肌肉在 “闹特性”

下一篇：没有了

热点资讯

milan 刚刚，GPT-5.5 发布！Claude Code 连夜治好降智，「奥特曼瘫倒」喜提续集

据外媒 Business Insider 报谈，Anthropic 在私募二级市集的估值已冲破 1 万亿好意思元。看成参照，OpenAI 本年 3 月末最新一轮融资的估值，仍停留在 8520 亿好意思元。除了业内须生常谭的「AI 泡沫论」，这组对比数据也标明了也曾稳坐头把交椅的 OpenAI，如今正在直面被追逐、被超越的压力，但莫得让咱们恭候多久，OpenAI 的反击眨眼间而至。就在刚刚，GPT-5.5 雅致发布，同步亮相的还有面向更高阶任务的 GPT-5.5 Pro 版块。若是用一句话...

milan 刚刚，GPT-5.5 发布！Claude Code 连夜治好降智，「奥特曼瘫倒」喜提续集

热点资讯

推荐资讯