9月30日消息,人工智能(AI)公司Anthropic于周一发布了其最新模型Claude Sonnet 4.5。这家获亚马逊投资、估值达1830亿美元的初创企业表示,Claude Sonnet 4.5在编程、计算机操作以及满足实际业务需求方面性能优异,且在网络安全、金融和研究等专业领域表现突出。该模型现已向所有用户开放。
Anthropic称,根据衡量AI系统软件编程能力的SWE-bench Verified等行业基准测试,Claude Sonnet 4.5是“全球最强的编程模型”。
Anthropic联合创始人兼首席科学官贾里德·卡普兰(Jared Kaplan)在接受CNBC采访时表示:“用户发现这款模型更智能、更像一位得力的同事。在协同解决问题时能给用户带来愉悦的体验。”
公司表示,新模型能够生成质量更高的代码,更擅长发现代码的改进空间,并且遵循指令的可靠性显著提升。
在此之前,Anthropic已于今年5月发布了Claude Sonnet 4,并于8月发布了Claude Opus 4.1。此次更新再次彰显了人工智能行业日新月异的发展速度。
Anthropic由前OpenAI研究人员于2021年创立,两家公司自此形成激烈的竞争格局。
2022年,OpenAI发布聊天机器人ChatGPT,引爆生成式人工智能热潮。今年8月份,这家估值已飙升至5000亿美元的初创公司发布了其最新模型GPT-5,但发布过程一波三折,部分用户抱怨无法再使用OpenAI的旧版模型。
Anthropic首席产品官迈克·克里格(Mike Krieger)则表示,Claude Sonnet 4.5将成为用户的默认模型,公司推荐的这款模型适用“几乎所有使用场景”。
他还补充说,付费订阅用户仍然可以选用Opus模型,而那些有特定工作流、尚未准备立即迁移的用户也可以继续沿用旧版Sonnet模型。
克里格补充道,Claude Sonnet 4.5的模型体量比Claude Opus 4.1更小,但“几乎所有方面”都更智能。
克里格说:“我们自己和客户都发现,这个模型在实际工作中极具实用价值。”
据Anthropic介绍,Claude Sonnet 4.5可持续自主运行长达30小时,期间能持续专注于处理复杂的多步骤任务。相比之下,今年5月份发布的Claude Opus 4只能自主运行7小时。
Anthropic还表示,他们通过大量的安全训练成功改善了模型的行为表现,有效减少了“欺骗行为”、“寻求控制权”以及“阿谀奉承”等不良倾向。
Claude Sonnet 4.5对“提示词注入攻击”也具备更强的防御能力,可有效避免被诱导执行泄露敏感数据等恶意操作。
卡普兰说:“这可能是过去一年到一年半以来,我们在安全性方面取得的最大突破。”
Anthropic还将发布更多新模型。卡普兰透露,更先进的模型即将问世,其中“很可能包括新版Opus”。
他表示:“虽然目前不会做出承诺,但我认为在今年年底前,我们很可能还会发布一到两款新模型。”
报道中特意提到,最近数周的多项研究表明,AI并未给竞相采用它的公司带来显著效益。但Anthropic强调,Sonnet 4.5在网络安全和金融服务等领域的任务中表现尤其出色。公司首席产品官克里格认为,企业要充分实现AI的价值,“必须要有几个大前提”,其中包括AI模型自身的进步以及“人们适应并改变现有的工作流程”。他还补充说,“前沿实验室与这些企业之间也需要建立更深层次的合作关系”。
认为,Anthropic发布Claude Sonnet 4.5标志着公司正向企业级AI市场纵深发展。该报道提到了Anthropic与微软的集成计划。后者于上周宣布,将为Microsoft 365 Copilot新增Anthropic模型驱动的一系列功能,其中包括Excel和Word中的“智能体模式”(Agent Mode)、Copilot聊天中的“Office智能体”(Office Agent)等等。随后还将在PowerPoint中上线相关功能。
提到,Claude Sonnet 4.5是Anthropic在AI智能体和AI编码领域抢占市场主导地位的竞争中迈出的重要一步。该报道表示,Anthropic、OpenAI、谷歌等公司一直在不断发布增量更新和新功能,让AI助手为消费者、企业和开发者提供更多服务。这场争夺用户关注度和依存度的竞赛几乎每月甚至每周都在升温。Anthropic的产品管理负责人Dianne Penn在接受采访时提到,新模型的运作水平达到了“参谋长级别”,能够查询多人日程找出空闲时间并安排会议,查看数据仪表盘整合不同见解,还能根据与下属的一对一会议内容撰写工作状态更新等。
(Business Insider)认为,此次升级距离前代产品Sonnet 4的发布仅四个月,凸显出Anthropic在生成式AI的激烈竞争中快速迭代产品的能力。该报道指出,新模型在模仿人类使用计算机的能力上取得了巨大飞跃。公司开发者关系主管亚历克斯·艾尔伯特( Alex Albert)在接受采访时表示:“这些进步证实,通过扩展计算能力等输入,AI模型的性能将持续提升。”该报道提到,Anthropic大力宣传新模型可以自主使用计算机、加强网络安全、开发实用应用程序和AI智能体,从而创造出实际的商业成果。文中援引艾尔伯特的话称,“编码和智能体能力的提升正在转化为实实在在的生产力增长。”
报道还提到了Anthropic在完善开发者生态方面的一系列动作。公司面向开发者推出原生VS Code扩展、增强的终端工作流等新功能,并允许工程师在AI项目偏离轨道时通过检查点功能即时回滚代码。此外,Anthropic还在Claude开发者平台上推出了一个Claude智能体软件开发工具包,为开发者提供精细化的工具,用于开发定制化、具备上下文感知能力的AI智能体。
4月15日消息,支付宝联合魔搭社区率先在国内推出“支付MCP Server”服务,让AI智能体一键接入支付能力,打通从AI服务到AI商业化的“最后一公里”。据测试,AI...
2 夸克爆火台湾,登顶App Store工具榜榜首4月17日消息,近日,阿里巴巴AI旗舰应用夸克在中国台湾地区意外走红,持续霸榜App Store工具类应用第一名,并一度攀升至App Store免费榜第二。社交媒体上,大量台湾用户分享使用体验...
3 苹果宣布一项新的 Apple 智能训练计划 完全在设备上进行周一,苹果宣布了一项新的 Apple 智能训练计划,用户可以选择加入。本质上,用户可以允许苹果使用 iPhone 上的内容来训练 AI 模型。训练过程完全在设备上进行,并采用了一种名为&l...
4 苹果 Siri 团队大换血:AI 浪潮下,新负责人能否力挽狂澜?4 月 23 日消息,今天(4 月 23 日)发布博文,报道称苹果新任 Siri 工程负责人 Mike Rockwell 正在对语音助手 Siri 的开发管理团队进行大刀阔斧的改革。据知情人士透露,Rockwell...
5 饿了么推出骑手AI助手“小饿”4月25日消息,饿了么正式推出AI“小饿”。据悉,这是国内首个基于大模型技术打造的骑手端智能体,旨在通过自然语言处理(NLP)、多模态交互及实时数据分析能力,为骑手打造...
6 QQ接入微信小程序,这两APP突然“和解”了?最近,先后和小伙伴们聊了聊安卓、iOS 端微信最新版本以及鸿蒙系统微信的更新情况。时至今日,微信早已成为我们生活中不可或缺的工具。无论是社交聊天、学习工作,还是生活缴费...
7 微信上线新模式!网友:更省心了!近日,微信官方宣布,微信未成年人模式正式上线:网友评论:更省心了!...
8 OpenAI放弃重组计划,AI巨头未来走向引关注5月6日消息,获悉,今晨OpenAI CEO奥尔特曼宣布,公司取消将经营主体从非营利组织法人转为营利有限责任企业的计划,未来仍由非营利组织监督控制公司发展并控股公益主体,同时推进营...
9 安卓重大更新!引入“任务栏”,谷歌意在提振手机生产力?将于2025年5月20日至21日召开的谷歌全球开发者大会(Google I/O 2025)已进入倒计时。为了即将举行的全球开发者大会,谷歌这次也是准备了不少预热好料,不仅提前宣布推出Gemini 2....
10 荣耀推出谷歌Veo 2模型支持的图片转视频AI工具5 月 12 日消息,荣耀推出了一款由谷歌技术支持的图片转视频 AI 生成工具,该工具将率先搭载于海外版的荣耀 400 和荣耀 400 Pro 两款手机,这两款手机将于 5 月 22 日正式发布。...
备案号:琼ICP备20001864号-1 Copyright © 2020-2021 海南金游汇电子竞技有限公司 版权所有