GoForum🌐 V2EX

公司想搞本地化算力部署 deepseek coder v2 给技术用,听到 AMD 锐龙 AI Halo 也不算贵,可行么

cheman · 2026-06-16 14:48 · 0 次点赞 · 18 条回复

AMD 锐龙 AI Halo 2.7w rmb ,现在每月花在 token 上的钱其实感觉是蛮多的,有这样的一个方向性的想法,不知道会有什么坑,或者问题,有人懂么,专业点的看法。

18 条回复
afkool · 2026-06-16 14:53
#1

要是我的公司就公司自己开 pro20 。。

javalaw2010 · 2026-06-16 14:58
#2

按照现在的说法,这玩意儿是上古模型了吧,部署这玩意儿干啥,形成不了生产力的话不就是在浪费钱吗

xtreme1 · 2026-06-16 14:58
#3

halo 主要是算力低 encode prefill 都很慢 其次也没涨到这么贵

这个规模的模型能不能满足你需求, 可以先租赁个云算力试一下

sentinelK · 2026-06-16 14:58
#4

1 、这个模型真的能符合你的需求吗? 2 、这个设备是统一内存,所以速度非常感人。你能忍受你每轮对话 1 分钟 AI 才吐字,10 分钟给你改一行代码吗?如果能忍你就可以冲。

zhangaugust · 2026-06-16 14:58
#5

这模型也太老了吧

ntdll · 2026-06-16 15:03
#6

你先买 100 块钱的这个模型 API ,给你的技术用一下,然后听听他的反馈,你就知道答案了。如果你都找不到这个模型的购买,那么答案你应该也已经知道了。

cheman · 2026-06-16 15:08
#7

@javalaw2010 谢谢解答。感觉 deepseek v4 pro 好像不太现实,或者 部署 deepseek v4 flash 比 deepseek coder v2 更好?或者有什么更好的模型推荐或者硬件搭配方案?

cheman · 2026-06-16 15:08
#8

@ntdll 谢谢解答。

op351 · 2026-06-16 15:08
#9

现阶段本地部署除了能保证 100%数据隐私合规可控,有什么其他优势?
而且真要合规的话和国内算力或者模型提供商签正规合同就好了,写好条款保证不收集任何数据。

fcten · 2026-06-16 15:13
#10

H20 整机大概 200 万,可以部署几乎所有的顶级开源模型了(如果不是全部的话)。这些钱如果用来采购 claude 的 api ,大概也就够十来个人的部门烧 2 个月。

实在要省钱,RTX PRO 6000 也行,整机估计 100 万吧。AMD AI Halo 这种消费级产品也就个人玩玩,公司还是算了吧。

cheman · 2026-06-16 15:13
#11

@op351 是的,我们的出发点还是钱的问题,因为每月也花 5-8K 在这上面,如果更便宜的话,是有点心动做本地化的

cheman · 2026-06-16 15:18
#12

@fcten 嗯嗯,谢谢你专业的解答,给到我具体的价位,现在有了大致清晰的认知。

cheman · 2026-06-16 15:18
#13

@sentinelK 确实要把这想法放放了

jackOff · 2026-06-16 15:18
#14

裁员一个员工经费不就有了?一个月才几千费用,总比一个员工上万工资支出好吧

emberzhang · 2026-06-16 15:23
#15

小公司比较合适的目前看来就是 deepseek-v4-flash 才能用且基本够用。但编程需要长上下文,要上下文满载 + 多用户并发还不慢的,性能要求可不低。2.7w 也就一台 GB10 的成本 ,肯定是不够的

xiaomushen · 2026-06-16 15:23
#16

这模型的 code 能力,远弱于 qwen3.6 27b

xiaomushen · 2026-06-16 15:23
#17

@fcten 合规使用 Claude ,确实贵得要命。而且在国内,就算合规使用,也是带些中间灰色环节的

jimrok · 2026-06-16 15:28
#18

先放一放,国产模型刚迈过可用的阶段,后续迭代可能要加速,建议还是找云端供应商,例如租火山或者腾讯的服务,自己建未必便宜。而且算卡的折旧会很快,3 年估计你的算卡就不值钱了。

添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: cheman
发布: 2026-06-16
点赞: 0
回复: 0