数智化转型网szhzxw.cn 人工智能资讯 重磅升级!Claude Opus4.1横空出世,编程能力直冲74.5%新高!

重磅升级!Claude Opus4.1横空出世,编程能力直冲74.5%新高!

今日,人工智能公司Anthropic正式发布其旗舰模型Claude Opus4的升级版——Claude Opus4.1。此次更新旨在全面提升模型的agentic任务、真实世界编程和推理能力,尤其是在编程和数据分析方面的表现引人注目。数字化转型网www.szhzxw.cn

根据官方信息,Claude Opus4.1的最大亮点在于其惊人的编程性能提升。在SWE-bench Verified编程评测中,其表现高达74.5%,这一成绩显示了其在处理复杂代码问题上的强大实力。GitHub的反馈也印证了这一点,开发者们普遍认为Opus4.1在多文件代码重构等任务上表现优于其前身。此外,日本电商巨头Rakuten Group也指出,新模型能够更精准地定位大型代码库中的错误,有效减少不必要的更改和潜在bug。

除了编程能力的飞跃,Opus4.1在深入研究和数据分析方面也有显著进步,特别是在细节追踪和agentic搜索能力上有所加强。Windsurf的基准测试结果显示,Opus4.1的表现比Opus4提升了一个标准差,这一进步幅度堪比Sonnet3.7到Sonnet4的跨越。数字化转型网www.szhzxw.cn

尽管此次升级带来了显著的性能提升,但Anthropic强调,Opus4.1属于渐进式改进,并非一次革命性的更新。它将继续按照**AI安全等级3(ASL-3)**标准部署,并在多项安全评估中表现出稳健性。新模型在拒绝违规请求方面的表现略有提升,无害响应率达到了98.76%。

此外,在儿童安全、政治偏见以及代理性能力测试中,Opus4.1的风险水平与前一版本保持一致,并且在极端滥用场景的配合度上降低了约25%,显示出更强的安全性。

Claude Opus4.1现已面向所有付费用户、Claude Code、API、Amazon Bedrock和Google Cloud Vertex AI开放,价格维持与Opus4相同。数字化转型网www.szhzxw.cn

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)鲍勃

免责声明: 本网站(http://www.szhzxw.cn/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。 本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等) 版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。https://www.szhzxw.cn/89081.html
联系我们

联系我们

17717556551

邮箱: editor@cxounion.org

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部