GoForum › 🌐 V2EX

Fable 5 的安全机制：回退 Opus 4.8

shineonme · 2026-06-10 09:28 · 0 次点赞 · 2 条回复

https://www.anthropic.com/news/claude-fable-5-mythos-5

发布如此强大的模型伴随着风险。如果没有安全措施，Fable 5 在网络安全等领域的能力可能会被滥用，造成严重损害。因此，我们在发布该模型时配备了安全机制：当用户查询某些主题时，系统将改用我们次强模型 Claude Opus 4.8 进行回复。为了在安全的前提下快速发布模型，我们采取了较为保守的安全设定——这些机制有时会误拦截无害请求（尽管平均触发率低于 5%）。随着未来几个月内更强大模型的陆续推出，我们正努力改进安全措施，降低误报率。

我们此前已发现，有大规模尝试从 Claude 中提取（“蒸馏”）其能力，用于在威权国家训练竞争模型。对 Fable 5 能力的蒸馏可能间接导致近前沿 AI 能力的扩散——而这些能力可能在缺乏适当安全措施的情况下被释放。被我们的分类器标记为属于此类蒸馏尝试的请求，将回退到 Opus 4.8 。

2 条回复

damontian · 2026-06-10 09:33

这家 ai 一直这么硬气？还没用过呢，一直 codex 和 ds ，听说封的厉害，单看这口气，np

RedNax · 2026-06-10 09:38

A 家一直反华，不奇怪。

添加回复

你还需要登录后发表回复

登录后可发帖和回复

登录注册

主题信息

作者: shineonme

发布: 2026-06-10

点赞: 0

回复: 0