🚀 OpenAI 发布 GPT‑5.4 — 专业AI工作的重大升级


OpenAI 于2026年3月5日正式推出 GPT‑5.4,这是其 GPT‑5 系列的最新版本。这个新模型在推理、编码、工作场所生产力和实际专业任务方面代表了AI的重大进步。
维基百科
🌟 什么是 GPT‑5.4?
GPT‑5.4 (生成预训练变换器 5.4) 是一款前沿AI模型,旨在比早期版本如GPT‑5.2和GPT‑5.3更强大、更高效、更可靠。它设计用于处理复杂推理、专业工作流程、编码任务和自主计算机操作。
维基百科 +1
主要有两种变体:
GPT‑5.4 Thinking – 针对ChatGPT中的深度推理和专业工作流程优化。
GPT‑5.4 Pro – 为API和企业环境中最艰难、最具挑战性任务的最大性能而打造。
OpenAI学院
🔑 主要特性与改进
🧠 1. 高级推理与事实准确性
GPT‑5.4 在事实性方面明显优于GPT‑5.2 — 假信息减少约33%,整体错误减少18%。
今日商业
在ChatGPT中,它可以在响应中间提供推理计划预览,让你无需重新开始即可优化指令。
今日商业
🧠 2. 超大上下文窗口
在API和Codex中,GPT‑5.4可以处理多达100万令牌的上下文——意味着它可以在一次会话中理解极长的文档、代码库或工作流程。
DataCamp
🖥️ 3. 原生计算机操作能力
GPT‑5.4 是首个能与电子表格、滑块、菜单和按钮等软件环境交互的通用OpenAI模型——实现跨应用的自动化工作流程。
今日商业
📊 4. 专业工作表现
独立基准测试显示,GPT‑5.4 在许多知识任务中与专业人类工作者相当或优于他们——在涵盖44个职业的GDPval测试中得分83%。
Beebom
🔧 5. 工具搜索与效率
新功能“工具搜索”允许模型在不一次性加载所有定义的情况下找到并使用合适的工具。这减少了令牌使用,加快了工作流程,特别是在工具繁重的开发者环境中。
WinBuzzer
📈 6. 编码与调试改进
GPT‑5.4 在编码基准测试中与GPT‑5.3‑Codex相当或优于,并包括实验性工具如可视化调试支持,帮助测试网页应用和软件。
Resultsense
💼 可用性与定价
✅ ChatGPT:
GPT‑5.4 Thinking 目前正在向Plus、Team和Pro用户逐步推送。
GPT‑5.2 Thinking 将在2026年6月5日前作为“遗留模型”继续提供。
经济学人
✅ API与Codex:
GPT‑5.4 (gpt‑5.4) 和 GPT‑5.4 Pro (gpt‑5.4‑pro) 已在API中上线。
维基百科
📊 定价 (API:
GPT‑5.4:每百万输入令牌约2.50美元, 每百万输出令牌约2.50美元
GPT‑5.4 Pro:每百万输入令牌约3.50美元, 每百万输出令牌约3.50美元
新定价反映了能力的提升,但更高的效率通常会降低整体使用成本。
Resultsense
💡 为什么这很重要
GPT‑5.4 标志着向专业级AI的转变,融合了深度推理、扩展上下文处理和实际计算机交互。它不仅仅是一个聊天助手——现在它是知识工作者、开发者和企业的强大生产力伙伴。
OpenAI
从自动化电子表格和代码库到生成长篇报告,像GPT‑5.4这样的模型正在推动AI在日常工作环境中的应用边界。
查看原文
post-image
post-image
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 1
  • 转发
  • 分享
评论
0/400
queen of the dayvip
· 3小时前
直达月球 🌕
查看原文回复0