关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西4160人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

入选全明星总次数:詹姆斯22次扩大优势,贾巴尔科比分列二三

懂球帝 浏览 3342

合计亏超22亿元,牧原、温氏一季度双双转亏

中国基金报 浏览 1682

美军称在东太平洋打击一“贩毒船” 致4人死亡

极目新闻 浏览 3908

中国使出大招 全世界嘲笑美:终于中国出来收拾美国了

南宫一二 浏览 8809

司乘天平上的滴滴

远川研究所 浏览 4598

售价8.88万起 RELY威麟R08上市

功夫AUTO 浏览 5419

广东移动发布三大提速行动,开启“算力即服务”新时代

环球网资讯 浏览 707

地点未定 摩擦又起 美伊核谈判开启前变数频生

极目新闻 浏览 3336

看了《沉默的荣耀》就明白:于和伟的班,娱乐圈没有人接得了

娱乐圈笔娱君 浏览 4584

具身智能何时实现“ChatGPT时刻”,王兴兴说了个关键前提丨聚焦进博会

红星资本局 浏览 4312

中超第27轮传球成功率榜:国安第一

体坛周报 浏览 4452

白银LOF变成了一种分级B

远川聊资管 浏览 3321

荣耀MagicOS 10系统第四批内测招募开启,截至11月19日

IT之家 浏览 4433

赖清德宣布追加400亿美元用于对美军购 提及2个时间点

经济观察报 浏览 33055

MIT最新发现:这十年,算法进步被高估了

机器之心Pro 浏览 3900

养老金增速领跑 险资投资版图更新

北京商报 浏览 4039

特朗普回应前助理被起诉:这是个卑鄙的家伙

参考消息 浏览 9511

Space X的护城河

华尔街见闻官方 浏览 3859

青海女官员于媛媛被"双开":生活奢靡 大搞权钱交易

鲁中晨报 浏览 10396

河北公务员,干出200亿乳品王国

创业家 浏览 3350

马克·库班抨击OpenAI情色计划:这将会适得其反

鞭牛士 浏览 4549
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1