GoForum🌐 V2EX

GPT 完胜 Claude

LonelyM · 2026-06-02 22:48 · 0 次点赞 · 11 条回复

🚀根据 DeepSWE (最佳编码基准)排名:

gpt-5.5 xhigh 完胜 opus-4.8 max

所以,聪明的你,选 Codex 还是 Claude code ?🙂

11 条回复
cairnechen · 2026-06-02 22:53
#1

4.8 等这波付费用户测试弄完了应该是会回升的,当然,这不影响我骂 A➗

409164 · 2026-06-02 22:58
#2

claude max 连 gpt5.5 high 都打不过吗?真的假的

Retas · 2026-06-02 22:58
#3

聪明的人会选择双持~

lujiaosama · 2026-06-02 22:58
#4

@Retas 两个都同时拉裤子呢。得等外星人发模型了。

409164 · 2026-06-02 22:58
#5

看了一下,做的只是 PASS@1 情况下的排行榜,实际上经过简单修正,还是 claude 的结果可用性更高

AS4694lAS4808 · 2026-06-02 23:13
#6

没人用 gemini 3.5 flash 么,我觉得也挺好用的,而且速度能到 300+

Retas · 2026-06-02 23:28
#7

@lujiaosama 两个都拉了就是天才程序员陨落了

lujiaosama · 2026-06-02 23:38
#8

@Retas 天才程序员选择用国模凑合,天才程序员发现自己服务器被干崩了

dingawm · 2026-06-03 00:13
#9

@409164 #5 “实际上经过简单修正,还是 claude 的结果可用性更高” 这个简单修改的结果哪里能看呢

409164 · 2026-06-03 00:18
#10

@dingawm 使用体感和员工反馈

dingawm · 2026-06-03 00:29
#11

@409164 #10 6

添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: LonelyM
发布: 2026-06-02
点赞: 0
回复: 0