资讯
2026-04-23 08:04 点击次数:56

Anthropic昨夜扔下了一颗重磅炸弹。Claude Opus 4.7崇敬上线。
在最要道的软件工程才气上,它完成了对GPT-5.4的卓绝,以至在某些辩论上濒临了尚未全面怒放的Claude Mythos Preview。
01 编程才气暴涨
Opus 4.7在代码范畴的施展极端出色。
在泰斗的SWE-bench Pro基准测试中,Opus 4.7的得分从4.6版块的53.4%径直跳涨至64.3%。

这是什么观念?
GPT-5.4在吞并测试中的收获是57.7%,而Opus 4.7联贯拉开了近7个百分点的差距。
而在SWE-bench Verified的收获是87.6%,比拟4.6的80.8%擢升近7个百分点。

这些数据的早期测试用户反映,昔日那些需要工程师盯着看的高难度编程任务,目下不错平缓地交给Opus 4.7孤苦完成。
因为它不仅能处理复杂的永劫任务,还会主动考据我方的输出,以至会在试验前进行「自我纠错」。
Stripe的工程团队在测试中提到:「Opus 4.7能在辩论阶段就捕捉到我方的逻辑舛错,并加快试验。这对需要大范围委派着实金融惩处有辩论的咱们来说,可能是游戏步调的编削者。」
02 视觉3倍分辨率
Opus 4.7新版块赞成高达2,576像素(长边)的图像输入,分辨率是前代模子的三倍以上,约3.75兆像素。
它不错看清复杂工夫图纸上的眇小标注,能准确解读化学分子的立体结构,在计较机操作任务中,能从高分辨率截图里识别出细枝小节的UI元素。
在CharXiv视觉推理基准测试中,Opus 4.7的得分从4.6的 69.1% 跃升至 82.1%;合作器具使用时,更是达到了91.0%,相较于前代的84.7%擢升弘大。

XBOW,即自主渗入测试平台,的测试数据更为震荡:在视觉浓烈度基准测试中,Opus 4.7得分98.5%,而Opus 4.6仅为54.5%。
「咱们最大的痛点整夜之间澌灭了」,XBOW团队暗示。
03 金融、法律、科研等方面也大有擢升
别觉得Opus 4.7仅仅个方法员专属模子。在多个专科范畴,它皆展现出了群众级的教授。
金融范畴,它在Finance Agent v1.1测试中取得64.4%的收获,并在 GDPval-AA,即第三方经济价值常识责任评估测试中创下Claude系列模子的最好施展。
从财务建模到专科演示文稿制作,Opus 4.7被评价为「比4.6更严谨的金融分析师」。
法律范畴,在BigLaw Bench测试中,Opus 4.7在高难度任务下达到 90.9%的准确率。
它能准确分辩「转让要求」和「甘休权变更要求」,要知谈,这然而前沿模子无数头疼的私密区别。
科研与多谈话,在Graduate-level reasoning测试中,Opus 4.7达到 94.2%,与GPT-5.4 Pro的94.4%和Gemini 3.1 Pro的94.3%处于吞并梯队;多谈话问答(MMMLU)也擢升至91.5%。
04 新版块特点
Opus 4.7在作为模式上有一个敬爱敬爱的动荡:它变得更擅长撤职指示,也更情景抒发专科不雅点。
一方面,它的指示撤职才气显赫增强。
Anthropic极端教导,昔日为旧版块编写的教导词可能需要从头调治,因为Opus 4.7会严格按照字面敬爱敬爱试验,而不会像4.6那样宽松确认注解或跳过部分指示。
另一方面,它在工夫连系中施展出更强的专科教授。
Replit团队赋闲到:它会在工夫连系中提议反驳,匡助我作念更好的决策。嗅觉确切像一个更好的共事,而不是一个只会说好的的应声虫。
此外,Opus 4.7在文献系统缅思方面也有矫正,能在永劫刻、多会话的责任中记取蹙迫札记,减少叠加高下文的输入。

05 安全、价钱与取得花样
安全预防是此次发布的蹙迫一环。
Anthropic暗示,Opus 4.7是齐集安全风险酌量神色框架下的首个模子,其齐集袭击才气比拟Mythos Preview已被各异化镌汰。

模子内置了自动检测机制,可困难高风险的齐集安全销耗请求。
诚然,正当的间隙酌量、渗入测试和红队测试并不在此列,安全专科东谈主士可肯求加入全新的Cyber Verification Program。
价钱方面,Opus 4.7看守与4.6疏通的订价,输入订价$5/百万token,输出订价$25/百万token。
目下,Claude网页端和App已全面上线,API模子称号为claude-opus-4-7,同期登陆Amazon Bedrock、Google Cloud Vertex AI和Microsoft Foundry。
但Claude近日要搞AI实名制,国内用户可能体验不到这波更新了。
(注:本文数据及引述均来自Anthropic官方发布)
Powered by Kaiyun网页版·「中国」开云官方网站 登录入口 @2013-2022 RSS地图 HTML地图