新闻资讯

OpenAI发布GPT-4.1系列最新模型,性能大涨

4月15日凌晨,OpenAI正式推出GPT-4.1系列模型,包括标准版GPT-4.1、轻量高效的GPT-4.1 mini和超小型性价比之选GPT-4.1 nano。

OpenAI发布GPT-4.1系列最新模型,性能大涨
(图侵删)

GPT-4.1系列在多模态处理、代码能力、指令遵循和成本方面实现显著提升。其更大亮点是支持100万token的上下文处理能力,是GPT-4o的8倍,这也是OpenAI首次发布长窗口模型。这一突破使得模型能够处理超长文本,如8套完整的React源码或成百上千页文档,适用于法律、金融、编程等领域的复杂任务。

在编码能力测试中,SWEBench评估将模型置于 Python 代码库环境,让其探索代码库、编写代码和测试用例。结果显示,GPT-4.1 的准确率达到 55% ,而 GPT-4o仅为 33%。

在多模态处理测试的视频 MME 基准测试中,GPT 4.1 对30到60分钟无字幕视频进行理解并回答多项选择题,取得72%的成绩,达到当前更佳水平,在视频内容理解上实现重大突破。

GPT-4.1系列在提升性能的同时,价格更具竞争力。GPT-4.1 相比 GPT-4o 价格降低 26%,而GPT-4.1 Nano 作为最小、最快的模型,价格也更便宜,每百万 token 的成本仅为12美分。

目前,GPT-4.1系列仅通过API提供,已对所有开发者开放。Windsurf决定为所有用户提供一周免费体验,随后以大幅折扣继续提供该模型。

不过,此次新发布的模型命名逻辑引发不少人吐槽,Open AI 不久前刚发布GPT-4.5,还夸赞GPT-4.5是比4聪明10倍的模型,转眼就又推出了 GPT-4.1,而且这次没说明,为何数字命名又倒退了。

不过,此次发布也意味着OpenAI正逐步淘汰旧模型,GPT-4.5预览版将于7月14日从API中下线,而GPT-4.1或将成为主流To B服务模型。

另外,GPT-4.1 nano API定价和 Gemini Flash 几乎相同,这是针对Google的又一次狙击。

之前,Gemini 2.0 Flash-Lite与OpenAI的GPT-4o-mini相比,成本更低。例如,GPT-4o-mini的每百万输入费用为0.15美元,输出费用为0.60美元,而Gemini 2.0 Flash-Lite的输入和输出费用分别为0.075美元和0.30美元‌。

OpenAI在模型进展不明显的情况下,推出够用且便宜的4.1,目的就是和竞争对手抢占市场,尤其是在B端市场接替3.5和4o mini。

4月10日,谷歌又推出了一款名为 Gemini 2.5 Flash 的全新 AI 模型,继续保持该模型价格较低、性能出色,以吸引用户。

早前,OpenAI 的创始人兼CEO山姆・奥尔特曼在社交平台𝕏上发布消息,宣布本周将推出 “很多” 令人期待的新产品,这些产品将从周二开始陆续上线。

他在本月初还曾提到,OpenAI 可能会在几周内发布新版本的 o3和 o4-mini,并预计在未来几个月发布 GPT-5。他表示,此次发布是为了使 GPT-5的表现超越最初的设想,GPT-5 将整合语音、画布、搜索、Deep Research 等功能,团队在整合各种功能时遇到了意想不到的挑战,因此希望能具备足够的产能来满足日益增长的需求。

 

  • 汽车股早盘普遍回暖 理想汽车-W及蔚来-SW均涨近4%
  • 俄美代表团在土耳其举行会谈
  • 澳门将从多方面促进青年就业创业,合资格澳门青年赴内地实习可获发5000澳门元
  • 娄永琪任上海工程技术大学校长,曾任同济大学副校长
  • “2025健康中国 医院院长研讨会”成功举办
  • 中行多家一级分行行长调整
  • 特朗普将为全美10个采矿项目提供快速审批通道
  • IPO周报|93.5元,今日申购新股创14个月最高发行价
  • 安踏收购狼爪,展露进攻中国大众户外市场野心
  • 为应对关税影响,爱马仕宣布在美国全线涨价
  • 拉加德据悉呼吁各国财长:让欧盟主导对美贸易谈判
  • 男子在足浴店欲与女技师发生性关系被控强奸,辩护律师称项目疑涉黄
  • 场外口水淹没比赛,津门虎全华班大败引发巨大争议
  • 燕京啤酒 2024 年业绩逆势增长:高端化战略显效背后的隐忧
  • 广电概念早盘活跃,华数传媒等多股涨停
  • 关键词: