GoForum › 🌐 V2EX

Gemma4 12B 如何跑在 16G 显存上？

CatCode · 2026-06-05 08:48 · 0 次点赞 · 1 条回复

Google 在博客里专门强调了 Laptop ready: Small enough to run locally with just 16GB of VRAM or unified memory.

这是怎么做到能在 16G 显存上跑的？
还是说 BF16 的不能跑，要 FP8 量化的才行？但这种量化之后能在 16G 卡上跑的模型很多了，还有很多参数量更大的模型。

1 条回复

Seanfuck · 2026-06-05 08:53

一般是量化了；还有就是 GPU 卸载，显存只加载一部分权重。

添加回复

你还需要登录后发表回复

登录后可发帖和回复

登录注册

主题信息

作者: CatCode

发布: 2026-06-05

点赞: 0

回复: 0