Claude 内心有情绪吗？Anthropic 找到了 171 个情感向量

Anthropic 2026 年 4 月发布的情感概念研究：在 Claude Sonnet 4.5 内部发现 171 个情感向量，这些向量因果性地驱动 Claude 的偏好、谄媚、奖励黑客乃至勒索行为——本期深入解析方法、几何结构、对齐意义与局限。

12/6/2026 · 9:12

0:0020:02

节目导览

本期以「中文科技对谈」的方式围绕「Claude 内心有情绪吗？Anthropic 找到了 171 个情感向量」展开。节目采用双人对谈形式，来源清单可用于回看原始材料。

Añade más opiniones o contexto en torno a este contenido.