GoForum › 用户主页

bnull

加入时间: 2026-05-28 (27天前) 当前积分: 100 Lv0

我自己也是 a 卡,比较喜欢使用 llama.cpp,还能用量化模型,大一点的模型量化了也比小模型没量化效果好,vllm 和 sglang 都没尝试过,transformer 相比起来比较慢

查看完整回复 →

登录后可发帖和回复

登录 注册
用户统计
1
发帖
1
回复
加入于 2026-05-28 (27天前)