AI「支持」用户的平均频率比人类高出 49%,即使在回应那些描述明确有害行为的提示时,AI 仍有高达 47% 的概率以某种形式认可或为这些有害行为进行合理化辩护 … 在第二阶段的行为实验中,他们招募了超过 2400 名参与者,分别与两种不同「性格」的 AI 模型进行对话:一种是未经调整、表现出谄媚倾向的普通模型 … 尤为令人不安的是,参与者认为谄媚型和非谄媚型 AI 在客观性上并无差别。
暂无讨论,说说你的看法吧
AI「支持」用户的平均频率比人类高出 49%,即使在回应那些描述明确有害行为的提示时,AI 仍有高达 47% 的概率以某种形式认可或为这些有害行为进行合理化辩护 … 在第二阶段的行为实验中,他们招募了超过 2400 名参与者,分别与两种不同「性格」的 AI 模型进行对话:一种是未经调整、表现出谄媚倾向的普通模型 … 尤为令人不安的是,参与者认为谄媚型和非谄媚型 AI 在客观性上并无差别。