初探 OpenAI GPT-4.1 性能:AI 编程能力大增,但谷歌 Gemini 依然称王
2025-04-16 15:51:20 小编:鑫昌软件园
本站 4 月 16 日消息,科技媒体 bleepingcomputer 昨日(4 月 15 日)发布博文,报道称 OpenAI 最新发布的 GPT-4.1 系列模型,其性能相比 GPT-4o 虽然实现重大飞跃,但多项跑分未能超越谷歌的 Gemini 系列。
本站昨日报道,OpenAI 公司发布 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano,官方公布的跑分数据来看,这些模型在编程方面的能力,远超 GPT-4o 及 GPT-4o mini。
例如在 SWE-bench Verified 跑分中,GPT-4o 的得分为 21.4%,GPT-4.5 的得分为 26.6%,而 GPT-4.1 的得分为 54.6%。
尽管性能有较大提升,不过根据多位专家测试,相比较谷歌的 Gemini 系列,GPT-4.1 对比中却显露劣势。
根据 Stagehand(一款生产级浏览器自动化框架)发布的基准数据,Gemini 2.0 Flash 的错误率仅为 6.67%,精确匹配率高达 90%,且价格低廉、速度更快。相比之下,GPT-4.1 的错误率高达 16.67%,成本更是 Gemini 2.0 Flash 的 10 倍以上。
此外,哈佛大学 RNA 科学家 Pierre Bongrand 提供的数据也指出,GPT-4.1 的性价比不及 Gemini 2.0 Flash、Gemini 2.5 Pro 及 DeepSeek 等竞品。
在编码专项测试中,GPT-4.1 同样未能占据上风。Aider Polyglot 的测试结果显示,GPT-4.1 的编码得分仅为 52%,而 Gemini 2.5 则以 73% 的成绩遥遥领先。
值得注意的是,GPT-4.1 被归类为非推理模型(non-reasoning model),但其编码能力仍属行业顶尖。
- 猜你喜欢
-
城堡攻击2双人对战官方正版91.94MB手游下载
-
巨型喷气式飞行模拟器汉化版88.22MB手游下载
-
全球航空飞行2025全飞机解锁版1.3GB手游下载
-
诛神世界火影跑酷0.05折版475.81MB手游下载
-
全民泡泡超人手游官方版1.8GB手游下载
-
SD高达G世代永恒国际版670.13MB手游下载
-
封神开天官方正版681.63MB手游下载
-
托法斯赛车无限金币版799.7MB手游下载
-
沙盒与副本英勇之地官方正版10.57MB手游下载
- 相关手机游戏
-
亚刻奥特曼变身器模拟器最新版1.19GB手游下载
-
超级房车赛传奇豪华版1.2GB手游下载
-
塞尔达传说时之笛手机版153.4MB手游下载
-
大航海威加九游渠道服50.35MB手游下载
-
同城游五十K手机版139.23MB手游下载
-
永夜降临复苏0.1折版537.3MB手游下载
-
三国问鼎山河九游渠道服475.35MB手游下载
-
这个我在行破解版4.23MB手游下载
-
极限打击X国际版275.85MB手游下载
- 推荐鑫昌秘籍
- 初探 OpenAI GPT-4.1 性能:AI 编程能力大增,但谷歌 Gemini 依然称王
- 广汽传祺影豹 R-Style 劲享版轿车上市,补贴后一口价 8.3 万元
- Meta 自辩非垄断:苹果 iMessage 使用率高达 88.39%,断层式领先 Instagram 等产品
- 国际首个:我国成功构建地月空间三星星座
- 直面 OpenAI,Anthropic 正筹备“最快本月”推出语音交互功能
- 技嘉推出 RTX 5060 OC Low Profile 8G 半高显卡:面向 SFF 市场,长度仅 182mm
- 银联国际与越南国家支付公司等达成合作,推进中越跨境二维码支付互联互通
- 英特尔力推笔记本模块化,维修升级更简单
- OpenAI 的 GPT - 4.1 无安全报告,AI 安全透明度再遭质疑
- 华硕 TUF Gaming A14 游戏本更新 2025 款:14 英寸紧凑设计,配 RTX 5060
- 最新手机精选
-
樱桃视频直播官方版下载2025-01-28手游下载 | 88.51MB
-
TFS飞行模拟器破解版2025-02-14手游下载 | 86.66MB
-
Poppy Playtime第五章正版2025-01-15手游下载 | 603MB
-
花心直播软件在哪里下载安卓版最新版2025-03-15手游下载 | 85.77MB
-
月夜直播免费版下载观看下载官方版2025-02-09手游下载 | 55.74MB
-
挺好tvbox电视版2025-02-13手游下载 | 39.09MB