2026年6月,AI公司Anthropic正式发布其大模型Claude的全新”宪法”(Constitution),这是一套塑造Claude行为模式的核心训练规范,对模型价值观与输出边界做出系统性更新。
据Anthropic官方介绍,新宪法源于其内部长期使用的训练技术演进,是公司模型训练流程中的关键组成部分,直接影响Claude在各类对话场景中的行为表现。其内容涵盖了Claude应如何在不确定情境中取舍、如何处理冲突性指令以及如何处理敏感议题等多个维度。
这是Anthropic自2023年首次公开Claude宪法以来的又一次重要迭代。新版本在透明度、用户安全和价值对齐方面均做出强化,旨在应对大模型在企业级、消费者级等高风险场景下的复杂需求。
与此同时,Anthropic还面临与白宫方面就其最新AI工具暂停公共访问的会谈压力,新宪法发布也被视为公司在监管压力下加强可信度与可控性的一次主动回应。
