GoForum🌐 V2EX

好奇 LLM 厂商是怎么给模型定价的

mingtdlb · 2026-06-15 00:03 · 0 次点赞 · 2 条回复

比如输出 1M 要多少钱,那他是怎么算生产 1M 的成本的,电力、硬件、维护

2 条回复
damontian · 2026-06-15 00:23
#1

应该是计算卡利用率吧,把成本均摊在上面

mhycy · 2026-06-15 00:38
#2

推理性能都是有数的,并发是可以通过队列控制的,剩下就是每天均摊载荷利用率,用集群成本除一下就知道每 M 价格了,这也是为何延迟越稳定、越低,越难得,因为这是一个队列等待的过程

添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: mingtdlb
发布: 2026-06-15
点赞: 0
回复: 0