GoForum › 用户主页
sentinelK
加入时间: 2025-12-27 (5个月前)
当前积分: 100
Lv0
回复了帖子 LLM 厂商降配降智是否符合什么什么商业之类的法律?
· 2天前
降智这种主观的都先不谈。
各家 plan 的“代币”有能说明白的吗? 现在 LLM 厂商给我的感觉,就是我进饭馆,我能吃什么,吃多少,花多少钱,都不是我能决定的。
回复了帖子 给一张照片,然后直接用自己的动作和表情来生成这个角色的视频,这个怎么实现的?
· 2天前
BFS 换脸,Klein 9B + VTON LoRA 换衣。这样就生成了初始帧。然后通过初始帧来进行 I2V 生成。
回复了帖子 编程可能是唯一一个面试比工作本身更难的职业
· 2天前
如果从广义的人才筛选角度上讲,普遍都是这样的。这是劳动人口供给关系决定的。
1 、这个模型真的能符合你的需求吗? 2 、这个设备是统一内存,所以速度非常感人。你能忍受你每轮对话 1 分钟 AI 才吐字,10 分钟给你改一行代码吗?如果能忍你就可以冲。
回复了帖子 lama.cpp 目前有重大性能 bug: checkpoint 的巡回逻辑对于混合模型(比如 qwen3.6-27B)无效,从而导致大概率每次对话都要 prefill 全文,严重拖慢速度
· 12天前
@zzutmebwd 不错的思路,反过来确实听上去也合理,回头尝试下
回复了帖子 lama.cpp 目前有重大性能 bug: checkpoint 的巡回逻辑对于混合模型(比如 qwen3.6-27B)无效,从而导致大概率每次对话都要 prefill 全文,严重拖慢速度
· 12天前
@zzutmebwd 肯定不是性能最优解,只是 all in one 的一个玩具妥协产物,不过确实如此,用 windows+wsl 掣肘太多。
回复了帖子 lama.cpp 目前有重大性能 bug: checkpoint 的巡回逻辑对于混合模型(比如 qwen3.6-27B)无效,从而导致大概率每次对话都要 prefill 全文,严重拖慢速度
· 12天前
@quickfox 确实,我的疏漏,感谢指证
回复了帖子 lama.cpp 目前有重大性能 bug: checkpoint 的巡回逻辑对于混合模型(比如 qwen3.6-27B)无效,从而导致大概率每次对话都要 prefill 全文,严重拖慢速度
· 12天前
@zzutmebwd 本人用 vllm 运行 nvfp4 ,不知为何总是启动的时候直接拉崩整个 wsl……日志能看到的都是 OOM ,不清楚 vLLm 到底在干什么……
回复了帖子 不懂就问-AI 开发
· 14天前
“不怕代码泄露吗” 怕的公司不会让用的。而且目前 AI Coding 的用量,在大公司整体有缩紧趋势。
相当于之前的半年到一年属于野蛮生长的探索阶段。现在逐渐趋于冷静了。
“还是说找 openai 、anthropic 这些公司合作的呢,比如签了签企业版合同,更强的数据隔离保障等?”没有…
第 1 / 10 页
下一页 →
其实这个问题是非常主观的。
学霸 A 刷遍了全世界所有的题,发现考试的时候撞题成功,考了满分。 学霸 B 智商超群,考试的时候利用其他题干互相印证推导,做题成功,考了满分。
他们都是满分,只是不稳定因素不同。
学霸 A 对于历史信息有过拟合。所以做题很难做满分。 学霸 B 推导…