执游网

Anthropic推出最新AI模型Claude Sonnet 4.5

  周一,Anthropic 公司推出了一款名为 Claude Sonnet 4.5 的新一代前沿模型。该公司称,这款模型在编码基准测试中展现出顶尖性能,不仅能构建 “可投入生产使用” 的应用程序(而非仅停留在原型阶段),其可靠性较此前的 AI 模型也实现了质的飞跃。

  用户可通过 Claude API 接口及 Claude 聊天机器人(19.530, 0.00, 0.00%)使用 Claude Sonnet 4.5。面向开发者的定价与 Claude Sonnet 4 保持一致:输入代币为每百万 3 美元(约合 75 万个单词,篇幅超过整套《魔戒》系列),输出代币为每百万 15 美元。

  Anthropic 表示,该模型在编码、计算机操作及满足实际业务需求方面能力更强,同时在网络安全、金融、科研等专业领域表现突出。目前,这家估值 1830 亿美元、由亚马逊支持的初创公司已向所有用户开放 Claude Sonnet 4.5 的使用权限。

  Anthropic 称,依据 SWE-bench Verified(一项衡量 AI 系统软件编码能力的测试标准)等行业基准,Claude Sonnet 4.5 堪称 “全球最佳编码模型”。

  Anthropic 联合创始人兼首席科学官贾里德・卡普兰(Jared Kaplan)在接受采访时表示:“人们使用这款模型后会明显发现,它更智能,也更像一位同事 —— 在遇到问题并解决问题的过程中,与它协作会带来一种愉悦感。”

  该公司指出,Claude Sonnet 4.5 能生成更高质量的代码,更善于识别代码改进空间,且执行指令的可靠性更强。

  此前,Anthropic 已于 8 月推出 Claude Opus 4.1,5 月推出 Claude Sonnet 4,而 Claude Sonnet 4.5 的发布,再次体现了 AI 行业飞速发展的创新节奏。

  Anthropic 由一群前 OpenAI 研究人员于 2021 年创立,自成立以来,两家公司一直是激烈的竞争对手。

  2022 年,OpenAI 推出 ChatGPT 聊天机器人,开启了生成式人工智能的热潮。目前,这家初创公司的估值已飙升至 5000 亿美元,并于 8 月宣布推出最新模型 GPT-5。不过,GPT-5 的推出过程并不顺利,部分用户抱怨无法再使用该公司此前的旧模型。

  Anthropic 首席产品官迈克・克里格(Mike Krieger)表示,Claude Sonnet 4.5 将成为用户的默认模型,且 Anthropic 建议该模型 “基本适用于所有使用场景”。

  但他同时指出,用户仍有其他选择:付费订阅用户仍可选用 Opus 模型;对于暂未准备好立即切换模型的用户,若其工作流程有特定需求,也可选择旧版本的 Sonnet 模型。

  克里格补充道,尽管 Claude Sonnet 4.5 的模型规模小于 Claude Opus 4.1,但 “在几乎所有方面” 都比后者更智能。

  克里格表示:“我们发现,这款模型对实际工作非常有帮助,我们的客户也有同样的感受。”

  Claude Sonnet 4.5 可自主运行 30 小时,Anthropic 称,在整个运行期间,该模型能始终专注于复杂的多步骤任务。而该公司 5 月推出的 Claude Opus 4,自主运行时长仅为 7 小时。

  Anthropic 还表示,通过广泛的安全训练,公司已改进了该模型的行为表现,减少了 “欺骗、追求控制权、阿谀奉承(即模型刻意迎合用户喜好输出内容)” 等 “问题行为”。

  此外,Claude Sonnet 4.5 对 “提示词注入攻击” 的抵御能力也更强 —— 这类攻击会诱导模型执行恶意操作,例如泄露敏感数据。

  卡普兰表示:“我认为,这是过去大约一年到一年半时间里,我们在模型安全性方面看到的最大突破。”

  Anthropic 已在规划后续模型的发布。卡普兰透露,更先进的模型即将推出,其中 “很可能包括 Opus 系列的新版本”。

 

  “目前无法给出承诺,” 他说,“但我认为,在今年年底前,我们或许还会发布一到两款新模型。”

最热新游

摩根大通刘鸣镝: 明年看好四大投资主题 对消费持乐观态度

  证券时报记者 许盈

  近日,摩根大通中国内地及香港地区股票策略研究主管刘鸣镝接受证券时报记者采访时表示,展望2026年,MSCI中国指数、沪深300指数及MSCI香港指数目标点位分别为100点、5200点和16000点,均存在约两位数的上涨空间。

  她认为,2026年四大投资主题值得关注:一是“反内卷”;二是全球AI基建开支增长;三是发达国家宽松政策对出口的提振;四是“K型”消费复苏对食饮及超高端消费的带动。

  光伏与储能更受青睐

  谈及市场热议的“AI泡沫”,刘鸣镝表示,泡沫成因通常是对盈利增长预期过高,导致估值达极端水平。她解释,估值在正态分布下通常于2个标准差内波动,超出3个标准差概率极低。今年10月初,内地半导体硬件板块估值曾触及4个标准差,近期虽回落至3.5个标准差以下,但仍处高位,显示情绪过热。

  对比四季度各行业预期,她认为,市场对金融行业预期较低,而对科技与医疗预期很高,后者需实现环比大幅的增长方能匹配市场的高预期。“我们判断半导体硬件等板块短期估值已偏高,短期存在压力。长期看,若进口替代、质量与产出能提升至新高度,当前估值或可获支撑。”

  在AI领域内,她认为基础设施设备(尤其是电力储能ESS)目前仅处于“恢复期”。因此,她对AI中的ESS(储能系统)、光伏、电池及电池材料等领域更为看好。关于出海主题,她表示电池、储能及光伏产业链的出口前景备受看好,这些行业能为数据中心提供快速电力解决方案,是2026年最看好的方向之一。

  “反内卷”聚焦成长型行业

  对于“反内卷”主题,刘鸣镝表示,明年继续看好有“反内卷”措施且需求景气的行业。她将相关行业分为三类:一是收入前景良好的成长型(如电池、光伏);二是与宏观紧密关联的周期型;三是与消费相关的领域。

  刘鸣镝认为,第一类行业表现将优于第二类,主因收入端具备提升潜力,尤其是AI数据中心建设带来的电力需求。“全球(中国内地以外) AI基建开支增长都需要电力,这是一个结构性机会。”她表示,将持续看好当前利润承压明显的光伏、碳酸锂、电池及电池材料领域。

  对明年消费持乐观态度

  谈及消费,她分析称,绝大部分省份可支配收入增长快于消费增长,表明家庭正在修复资产负债表。

  “整体贷款与负债情况均向好,核心问题在于信心不足。”她对明年消费持相对乐观态度:“第一,不完全是没有钱消费,而是缺乏信心等因素影响;第二,从中央经济工作会议来看,消费与地产将是明年政策的重点关注领域。”

  从估值水平来看,她认为,相对美国、日本及印度,MSCI中国必选消费指数的市盈率最低、股息率最高。“印度必选消费板块市盈率约50倍,中国则不到20倍。从相对估值角度,我们持续看好必选消费。”

 

  “我们的判断与市场一致预期略有不同:对估值较高的板块建议保持审慎,对估值较低的板块则建议不要过度低配。”刘鸣镝说。