GoForum › 用户主页
sentinelK
加入时间: 2025-12-27 (5个月前)
当前积分: 100
Lv0
lama.cpp 目前有重大性能 bug: checkpoint 的巡回逻辑对于混合模型(比如 qwen3.6-27B)无效,从而导致大概率每次对话都要 prefill 全文,严重拖慢速度
🌐 V2EX
12天前
0 回复