重磅!OpenAI正式发布GPT - 5,多领域能力惊艳升级

发布于:2025-08-08 阅读:0
当地时间8月7日,OpenAI正式推出GPT - 5。其智能性能远超以往,在编码、写作、健康等领域显著提升。能一键生成网页,写作如诗人,还能更好标记健康问题。面向所有用户开放,微软抢先接入。这是人工智能的重大升级,值得关注。

当地时间周四(8月7日),OpenAI官方正式推出了备受外界期待的新一代人工智能模型GPT - 5。OpenAI在新闻稿中表明,GPT - 5的智能性能远超公司之前的所有模型,在编码、数学、写作、健康、视觉感知等领域均拥有卓越的性能。

GPT - 5

GPT - 5是一个统一的系统,它能够识别何时快速响应,何时需要更长时间的思考以提供专家级的应答,用户不必手动选择使用常规语言模型还是推理系统。

OpenAI表示,GPT - 5将面向所有用户开放。Plus会员可获得更多使用量,Pro会员则可访问GPT - 5 Pro版本,该版本具有扩展推理能力,可提供更全面、更准确的答案。

OpenAI首席执行官萨姆·奥尔特曼称GPT - 5是一次“重大升级”,“这还是第一次,真的像是在与某个领域的专家对话”。ChatGPT团队负责人Nick Turley也表示,新模型在响应速度、回答准确性以及减少“幻觉”方面都优于前代产品,和它对话感觉自然了不少。

作为OpenAI的“最强大模型”,GPT - 5在三个关键领域实现了显著提升。

首先是编程能力。GPT - 5是OpenAI迄今为止最强大的编码模型,在复杂的前端生成和大型代码库调试方面表现突出。它能够仅凭一个提示就创建美观响应式的网站、应用程序App和游戏。早期测试者注意到其在间距、排版和留白等设计选择方面的改进。

在从GitHub获取现实世界编码任务的基准测试SWE - bench Verified中,GPT - 5思考后首次尝试的准确率达74.9%,高于OpenAI推理模型o3的69.1%和GPT - 4o的30.8%。评论指出,这意味着GPT - 5的表现略胜于Anthropic周二推出的Claude Opus 4.1和谷歌DeepMind的Gemini 2.5 Pro。

编程能力

OpenAI的研究者还做了实例演示,要求GPT - 5创建一款网页App,帮助说英语的用户学习法语,且该App必须有一个引人入胜的主题,包含抽认卡、测验、经典的贪吃蛇游戏,以及追踪每日学习进度的方法。几分钟后就生成了两个不同的App,虽然存在一些缺陷,但用户可以根据个人喜好再调整AI生成的软件。

在创意写作方面,GPT - 5能够处理结构复杂的写作任务,如无韵律的抑扬格五音步诗或自然流动的自由诗,犹如诗人。OpenAI的ChatGPT业务副总Nick Turley表示,GPT - 5在创意任务上表现出“更好的品味”,响应更自然。

健康咨询是第三个重要提升领域。GPT - 5能更积极地标记潜在健康问题,帮助用户解析医疗结果,不过OpenAI强调,ChatGPT不能替代医疗专业人员。在名为HealthBench Hard Hallucinations的测试中,具备思考能力的GPT - 5出现幻觉的错误信息率仅为1.6%,远低于GPT - 4o和o3模型。

健康咨询

OpenAI称,GPT - 5相比此前的模型更可靠和实用,它能更准确地回答现实世界的疑问,出现幻觉的可能性显著降低。

此外,OpenAI还为GPT - 5引入了一种新的安全训练形式,名为安全补全(safe completions),它能教模型在安全范围内尽可能给出最有帮助的答案。OpenAI还将为所有ChatGPT用户推出四种预设性格的全新研究预览版,用户可在设置中随时调整,用以匹配ChatGPT和用户的沟通风格。

值得一提的是,微软在GPT - 5发布当日即宣布,将其整合到广泛的产品线中。企业用户和消费者都能通过不同方式免费体验GPT - 5。开发者也将通过GitHub Copilot和Visual Studio Code获得GPT - 5支持,用于编写、测试和部署代码。

二维码

扫一扫关注我们

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件至admin@pbootcms.com举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签: GPT - 5 OpenAI 人工智能 编程 写作 健康咨询

相关文章