OpenAI发布GPT-4.1系列最新模型，性能大涨

4月15日凌晨，OpenAI正式推出GPT-4.1系列模型，包括标准版GPT-4.1、轻量高效的GPT-4.1 mini和超小型性价比之选GPT-4.1 nano。

（图侵删）

GPT-4.1系列在多模态处理、代码能力、指令遵循和成本方面实现显著提升。其更大亮点是支持100万token的上下文处理能力，是GPT-4o的8倍，这也是OpenAI首次发布长窗口模型。这一突破使得模型能够处理超长文本，如8套完整的React源码或成百上千页文档，适用于法律、金融、编程等领域的复杂任务。

在编码能力测试中，SWEBench评估将模型置于 Python 代码库环境，让其探索代码库、编写代码和测试用例。结果显示，GPT-4.1 的准确率达到 55% ，而 GPT-4o仅为 33%。

在多模态处理测试的视频 MME 基准测试中，GPT 4.1 对30到60分钟无字幕视频进行理解并回答多项选择题，取得72%的成绩，达到当前更佳水平，在视频内容理解上实现重大突破。

GPT-4.1系列在提升性能的同时，价格更具竞争力。GPT-4.1 相比 GPT-4o 价格降低 26%，而GPT-4.1 Nano 作为最小、最快的模型，价格也更便宜，每百万 token 的成本仅为12美分。

目前，GPT-4.1系列仅通过API提供，已对所有开发者开放。Windsurf决定为所有用户提供一周免费体验，随后以大幅折扣继续提供该模型。

不过，此次新发布的模型命名逻辑引发不少人吐槽，Open AI 不久前刚发布GPT-4.5，还夸赞GPT-4.5是比4聪明10倍的模型，转眼就又推出了 GPT-4.1，而且这次没说明，为何数字命名又倒退了。

不过，此次发布也意味着OpenAI正逐步淘汰旧模型，GPT-4.5预览版将于7月14日从API中下线，而GPT-4.1或将成为主流To B服务模型。

另外，GPT-4.1 nano API定价和 Gemini Flash 几乎相同，这是针对Google的又一次狙击。

之前，Gemini 2.0 Flash-Lite与OpenAI的GPT-4o-mini相比，成本更低。例如，GPT-4o-mini的每百万输入费用为0.15美元，输出费用为0.60美元，而Gemini 2.0 Flash-Lite的输入和输出费用分别为0.075美元和0.30美元‌。

OpenAI在模型进展不明显的情况下，推出够用且便宜的4.1，目的就是和竞争对手抢占市场，尤其是在B端市场接替3.5和4o mini。

4月10日，谷歌又推出了一款名为 Gemini 2.5 Flash 的全新 AI 模型，继续保持该模型价格较低、性能出色，以吸引用户。

早前，OpenAI 的创始人兼CEO山姆・奥尔特曼在社交平台𝕏上发布消息，宣布本周将推出 “很多” 令人期待的新产品，这些产品将从周二开始陆续上线。

他在本月初还曾提到，OpenAI 可能会在几周内发布新版本的 o3和 o4-mini，并预计在未来几个月发布 GPT-5。他表示，此次发布是为了使 GPT-5的表现超越最初的设想，GPT-5 将整合语音、画布、搜索、Deep Research 等功能，团队在整合各种功能时遇到了意想不到的挑战，因此希望能具备足够的产能来满足日益增长的需求。