GoForum › 用户主页
KaiWuBOSS
加入时间: 2026-04-24 (9天前)
当前积分: 100
Lv0
第一次发仓库项目 没经验 😰
0.1.1 版 ios3 脚本没上传上 正在编译 0.1.2 估计三个小时后发布
@sentinelK 我也参考了他的 fiton 但他没有涡轮量化 另外我还做了上下文优化 相比而言 我这个不用调参 而且是硬件最大上下文 最优显存 -fit on 是随机削层,Kaiwu 是精准分层。
–fit on:显存不够就把后面几层丢给 CPU , 不管是什么层,速度损失大。 …
@zrlhk 我的错 我的上传脚本有问题 晚点推 0.1.2 你要方便可以试试 qwen3 应该没问题
@damontian 换 Qwen3-30B-A3B 这个模型专为低显存优化 3080 10GB 跑起来没问题
@damontian 直接上 30b 模型你选你喜欢的 50 系列看 nvfp 的
我马上优化一版 空了再试试 gemma4 支持 ios3 的呀 判定有问题
回过头来看 这个帖子怎么写得这么煽动。。。 其实我就是一个人能力不够想找专家帮忙一起写这个项目,我已经有个 MVP 这两天把稳定性跑跑就能发仓库了。