GoForum🌐 V2EX

有大佬用上了 Claude Mythos Preview 吗?感觉挖洞是下一个被颠覆的工作了

GG5332 · 2026-05-30 10:03 · 0 次点赞 · 6 条回复

Anthopic 四月发了博文说搞了一个 Claude Mythos Preview ,挖了 500+个漏洞,前几天又更新了进展,扫描了 1000 多个开源项目发现了估计为 23019 个漏洞,某家独立的安全研究公司对其中 1752 个高危或严重级别漏洞进行了仔细评估,其中 90.6%( 1587 个)被证实为有效漏洞,62.4%( 1094 个)被确认为高危或严重级别。然后五月份 OpenAI 也推出了同类产品”daybreak”,效果如何没有说,但是给我的感觉挖洞这个工作是不是 Anthropic 继搞定编程这个工作后,准备要颠覆掉的下一个工作?给人感觉 Anthopic 不像其他 AI 公司开口闭口我要 AGI ,它就默默的干,一个一个领域的突破。Claude Mythos Preview 由于太牛逼 Anthropic 说在他们开发出更加牛逼的防护系统之前不对外发布,只给一些信得过的 partner 使用,有没有大佬实际用过啊?是否真的那么牛逼。

4 月博文: https://red.anthropic.com/2026/mythos-preview/ 5 月博文: https://www.anthropic.com/research/glasswing-initial-update openai 跟进: https://x.com/OpenAI/status/2053939702110269822

6 条回复
w568w · 2026-05-30 10:23
#1

https://daniel.haxx.se/blog/2026/05/11/mythos-finds-a-curl-vulnerability/

省流:Curl 作者试用了 Claude Mythos ,在 Curl 项目上进行扫描。在公开投票中,大部分用户认为能发现 10 个或更多 CVEs 。

但 Claude Mythos 最终信心满满地报告「发现了 5 个确信的漏洞」,并且经过开发者复查后,其中 3 个都是误报,剩下 2 个中,1 个被认为是「 bug 而非安全漏洞」,另一个被认定为「低危漏洞」「不会造成严重后果」,不过出于对报告的尊重,依然分配了 CVE 编号并进行了安全修复。

Claude Mythos 确实发现了约 20 个 bugs ,「几乎没有误报」。不过 curl 作者表示,「就发现的问题数量而言,我们之前使用的所有 AI 工具都带来了更多的 bug 报告」。

作者的结论是:「我个人的结论只能是,目前围绕这个模型的种种炒作主要还是营销噱头。我没有看到任何证据表明,与 Mythos 之前的其他工具相比,这个模型在发现问题方面有任何显著的提升或改进。或许这个模型略胜一筹,但即便如此,它的优势也并不足以对代码分析产生实质性的影响。」

zcsexp · 2026-05-30 10:28
#2

我用了一段时间,不过对于一般的小项目,貌似没啥明显的感觉。。。

licolicoli · 2026-05-30 10:28
#3

这里应该找不到能用上这种模型的人…

不过我觉得挖洞确实比编程靠谱,毕竟做项目我们还能谈谈“架构”、“品位”、“设计”这种主观的东西,还有历史遗留项目需要理解来龙去脉的人来维护。挖洞可不用管这么多,挖到一个洞就是胜利;何况人的精力是有限的,不可能一会研究这个一会研究那个,LLM 通电就行,7x24 拿什么打?

我觉得以后新的代码我们都会默认先给主流 LLM review 一遍,从开始就减少犯错的机会。大部分开源项目会在接下来几个月迎接一波大的,比方说你可以看检测开源项目安全状况的 oss-security 邮件列表: https://www.openwall.com/lists/oss-security/ 最近新披露的漏洞呈指数上升,但总会趋于平缓,直到历史遗留的代码被扫干净,摘完这波果子就无了。

licolicoli · 2026-05-30 10:28
#4

被打脸了,刚发完楼上就有用过的(

licolicoli · 2026-05-30 10:33
#5

另外我觉得其实这是好事,这些开源项目的 0Day 肯定有很多已经被独立发现过并且作为武器使用。现在 LLM 直接捅了篓子,堵 > 瞒。

GG5332 · 2026-05-30 10:48
#6

@licolicoli 哈哈,华人跟 V 站还是很牛的~

添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: GG5332
发布: 2026-05-30
点赞: 0
回复: 0