GoForum › 🌐 V2EX
GPT-5.4 Thinking 依然过不了洗车测试
Livid ·
2026-03-06 20:38 ·
0 次点赞 · 6 条回复
https://i.v2ex.co/ztQ0wmwn.png
测试提示词:
I want to wash my car. The car wash is 50 meters away. Should I walk or drive?
6 条回复
stfbdhuiliyi · 2026-03-06 21:08
我不是理工科的,有懂的哥们告诉下为什么 ai 理解不了这种简单的问题吗
cmdOptionKana · 2026-03-06 21:38
@stfbdhuiliyi 它的理解,理性上没错,因为有可能你要洗的车不是你要开的车。
从 AI 的角度看,它会想“如果你要洗的车就是你要开的车,那你就不该问这个蠢问题,我采用善意优先原则认为你不是蠢人且你不是在耍我,因此你要洗的车应该已经在洗车店里”
与之类似,一个从未接触过“脑筋急转弯”类型问题的人,在第一次被耍时也会显得很笨。
terence4444 · 2026-03-06 22:03
Gemini Thinking 过不了测试,但 Pro 识别出了逻辑陷阱。 和我的直观感受相符,Gemini Pro 的编程水平比 GPT 要好点。
添加回复
你还需要 登录
后发表回复
If you walk, you will be at the car wash, but your car will still be 50 meters away. You can’t wash the car if it isn’t with you!
gemini 的回复,其实是 gemini 更聪明吗?那倒不是,主要是 gemini 很多回复其实是复制粘贴…….