GoForum › 🌐 V2EX

未来大模型硬件成本下降 5-10 倍，我们的未来会是什么样的？

LeeReamond · 2026-06-16 01:48 · 0 次点赞 · 15 条回复

说实话最近工作没有太多需求，空下一些时间深夜做一些无所谓的瞎想。

众所周知的是，2023 年 gpt3 刚出来的时候大家可不像今天这么感觉大模型能完美替代几乎所有程序员工作。而 2023 年到现在也不过 3 年。那么，如果再把时间维度拉长到 3-5 年，我们的未来会是什么形态？

已知前提：

模型的提升本质上实际上是信息密度提升，存在边际效应，但是从 2026 回看过去三年，已经提升很多，未来仍有一定提升空间。
nvdia 的硬件是存在高溢价的，仅从成熟制程集成电路技术的角度来说计算成本没有现在这么贵。

与大模型聊天后做出的推断性判断：

已知过去三年间低端模型（个人用户的消费级硬件有潜在希望能运行的模型，例如 64B 及以下模型）的部署成本大概降低了 1000 倍。
高端模型（ 1-1.5T 参数）所依赖的部署设备的成本，如果能够去掉类似 cuda 护城河和 nv 溢价的话，未来也不会下降太多，但是下降 5 倍是可能的（也就是说类似于企业部署满血 deepseek v4 pro ，目前的成本比如是 300 万一台机器的话，未来理想情况下可能降低至 60 万，应该不会再低了）
目前看来可能的提升模型能力的方向，例如多 agent 任务流，消耗 token 数量大概是普通对话的 10 倍左右。
以当下的重度 LLM 用户的使用习惯来看（考虑人机交互中人类心智端的极限），取决于任务的不同，每天生成 token 数大概在 1M-100M 之间。

那么综合推断下来 3-5 年后的未来会存在这样一批人：

每天使用大模型综合 token 输出数量在 10M-1000M 之间。
使用多 agent 执行各种复杂任务
使用次旗舰级别开源模型，能力超过或与当下的旗舰模型持平（假设与 Fable5 持平）
每 1Mtoken 的输出成本，按现在的购买力计算，约与当下的 deepseek 官方 api 价格持平（ 3-6 元每 M ）
也就是未来会存在一些每天花费大约一百-几百到 1-2 千元 token 成本，生产效率约等于无限制使用现在的 claude Fable5 模型进行各类工作（很可能是多模态工作）的这么一些人。

所以未来编程行业会是什么样呢？未来各行各业会是什么样呢？大厂工作的人我感觉未来 5 年应该都能做到上述推断的程度，大厂的生产力会前所未有的蓬勃，个人工作者市场应该会完全消失。其他所有从事文创、生产类工作的工作者，比如在起点写小说的，可能会有 fable5 帮忙连续不断地 24 小时推演。

15 条回复

LeeReamond · 2026-06-16 01:53

大概四五年前，程序员开发副业还有通过类似个人编程能力，实现潜在财富自由的指望（比如开发一款好用的 app ）。当年站内比较火的有类似于记账软件产品被大厂抄袭之类的事发生。那么随着现在大厂生产力越来越蓬勃，以后这些中小软件 app 开发致富的路子应该完全不会有市场？中小厂商都要倒闭？

trn4 · 2026-06-16 01:58

你这话仿佛是在上个世纪内存还是 640KB 的时候问：”未来内存涨到 8MB 了会是什么样子？“。安迪比尔定律告诉你了，硬件再强都会有更强的模型把他耗尽。你的硬件永远不够。

trn4 · 2026-06-16 01:58

@trn4 #2 简单来说就是 AI 工作流消耗越来越高，高端模型依旧高质高价拿走大部分利润，低端进入价格战普及模式。计算机发展史已经走过一次了。

LeeReamond · 2026-06-16 02:08

@trn4 我是站在历史潮流里一个渺小的人，如果我生活在 1990 ，我想知道人均内存 1G 的时代是什么样子，4G 的时代是什么样子，64G 的时代是什么样子。高端模型的高质高价我倒感觉边际效应越来越明显了，模型不断地变聪明，但是又能聪明到哪里去呢？硬件成本下降和服务竞争红海化我倒感觉你说的低端价格战普及会带来的影响更大一些

xlxx · 2026-06-16 02:53

🎅有可能能把软件外包价格打下来？

tywtyw2002 · 2026-06-16 02:58

@LeeReamond 有些基础理论，你可以问问 AI 去了解下。

对于内存 cpu 的例子，针对大型企业用户的例子是成本指数级下降。以前大型运算要 openmp ，并且不便宜。2012 年左右成本就已经可控了，不需要搞一机房服务器就能算了，一机柜足以。然后 2018 年，一台服务器对于很多计算都足够了。然后就没人搞服务器了，直接 aws 算了。

ai 基础算法 1990 年代就以及有了。剩下的就是算力。

LeeReamond · 2026-06-16 03:43

@tywtyw2002 我觉得倒不用说 bp 在多少年前就有了这种废话。至于企业级内存 cpu 成本下降的例子，你看 cuda 都是一个多少年的产品了，到现在科学计算还是这套东西，它的成本下降会继续走以前的路子吗？ 6 年时间里从一个机房缩减到一台单机？我不看好。

trn4 · 2026-06-16 04:08

@LeeReamond #4 “但是又能聪明到哪里去呢？”你在问一个目前还没有答案的问题，而你已经有了你自己的答案并且基于你的答案开始推演了。

msg7086 · 2026-06-16 04:48

但是又能聪明到哪里去呢之前大家也是这么说的。

现在的模型还有非常大的提升空间。比如超长上下文注意力不集中的问题，给个 250k 的上下文 AI 就不知道自己前面在想什么了。还有思考能力的问题，现在模型可以做中高级难度的开发，但是再往上，比如到复杂的系统设计，就开始不行了。这些如果能再改善一些，就又能大幅提升一把智力。

至于将来会变成怎么样，说实话谁都说不准，问了也无非就是大家拍脑袋想想而已。

LeeReamond · 2026-06-16 04:53

#10

@trn4 @msg7086 我觉得这个问题是这样，模型智力的问题现在边界是能看见的，不是很久之前就有人说全网的语料都被训练完了。所以未来的提升我感觉应该是智力上限提升很困难，但是从信息密度的角度不断的凝练是很有可能的，可能将来 300B-1T 之间的中型模型的智力还会有显著进步。

所以不妨基于这个前提可以推演一下当广谱智力真的普及之后社会形态会变成什么样，我觉得拍脑袋想想也没啥不好的么，1920 年还有科幻小说呢，其中不乏也有预测未来预测的很准的

ntdll · 2026-06-16 04:53

#11

那么随着现在大厂生产力越来越蓬勃，以后这些中小软件 app 开发致富的路子应该完全不会有市场？中小厂商都要倒闭

如果这个说法成立，那么至少在 20 年前就已经被大厂垄断了。

技术人员不要把自己看的太重要，一款产品，不论是传统行业还是信息技术行业，专业技术人员在其中的重要程度是最低的，也就是最不重要的，除了一些高精尖的领域。

非高精尖领域的技术人员的所有问题，花钱都可以解决，不存在真正的专业壁垒。

而市场推广和营销是花钱也解决不了的，时代的机遇（或者说运气）同样也是花钱也解决不了的。

当年还不是大厂的小米，做出来的米聊，为什么只有腾讯抄了，而且还成功了，同为大厂的阿里真的是因为技术原因做不出来嘛。

当年如日中天的诺基亚，是如何都还没看清对手，就被 iPhone 埋入了土里。

彼时小作坊米哈游，凭借 50 万启动资金，做出了崩坏学园，更成为了现在二游市场的一座高峰。

技术很重要，但是没那么重要，相比而言，能把产品推广出去远比技术更重要（更难），这里面也需要不少运气的成分。

LeeReamond · 2026-06-16 05:03

#12

@ntdll 你说的这个肯定是对的，但是我觉得现在的一个改变是，大厂肯定还是有大厂的毛病，以前不是技术不到位，很多时候是非技术问题。但假定给你一个无限蓬勃的生产力预期的话，比如以前我们出现一个爆款 app ，大厂要复刻可能要拉一个组出来，以后它可以搞一个组专门复刻市面上的各种 app 然后加到自己家的小程序平台里，现在也不是需求很蓬勃的时代了，一个组能把全网能做的全做了。然后另一个组专门搞推广，推广能力也比以前强。从个人开发者的角度跟这种体量的东西竞争实在是想不出什么能赢的点。

msg7086 · 2026-06-16 05:38

#13

@LeeReamond #10 当然有预测未来预测得很准的，但这意义不大。学过信息论就知道，这样的讨论就等于没有信息量。比如你预测，明天可能下雨，但也可能不下。晚上可能吃面，也可能不吃面。你说未来 50 年内核聚变可能可以投产使用，但也可能无法投产使用。这是不是预测了个寂寞。

咱不说那么复杂的东西，就像你说的 GPT3.5 出来的时候谁会想到现在大模型+Agent 可以直接上手半自动化开发复杂的软件。当时的你可能连 Agent 这样一个东西将会被发明出来都不知道。没有多少人类可以凭空想象出还不存在的东西，如果你可以，那你应该开始创业。

很久以前在油管上看过一个视频，里面就提到了未来人类会遇到的情况。你进入大学学习，然后大一大二学到的前沿知识，到了大学毕业的时候就已经过时了。你高中时候对未来做了职业规划，想着将来我要在某某行业做某种工作，结果到了找工作的时候发现，这个工种已经消失了。而取而代之的工作岗位，可能是三五年前根本还不存在的工作，工作内容要处理的，甚至是人们可能从来没想过的问题。整个世界都在以指数级的速度发展，过去 5 年内创作出的新知识可能比过去 5000 年的还要多。

当然我不是说不能去预测未来，只是未来的变化实在太快了，在新的变化出来之前你可能根本就没想到这会是个变化，历史的滚滚洪流就把你当减速带碾过去了。

顺便一提，就算能去掉 CUDA 护城河，你用 AMD 的显卡也不会便宜。如果 N 卡和 A 卡都降价了，Cerebras 也不会便宜。Cerebras 如果便宜了，那人类就可以迈出一大步了。

现在大模型的弱点，除了上面说的注意力和智力，还有速度。现在普通人用的 AI 无非也就是几十 tps ，你要用美国豆包 3.5 Flash ，那说不定能跑个小几百 tps ，要实时响应还是太慢了。如果能保持现在 5.5 xHigh 的智力水平然后再把速度提升 20 倍，那开发的体验会好很多。当然价格如果能打下来那就更好了。现在写个大项目一个月得花好几千，要不是公司买单，我自己掏钱做开源软件那是真用不起。

ntdll · 2026-06-16 05:43

#14

@LeeReamond #12 ，以这种视角来看待，各行各业，都有自己的“大厂”，这同样和 IT 行业无关，也和 AI 无关。那各行各业的小作坊就应该都不存在了。

如果现在国内的腾讯、阿里，海外的微软、Google ，只要他们愿意，并不需要 AI ，他也可以把全网所有个人开发者能做的都做了，也可以推广，他们并不差钱，也并不差人。但事实并没有这样。

我不知道你是如何认为大厂们为什么不这样做的。我肤浅的认为就是“不想”，因此在后 AI 时代，大厂们也依旧“不想”，这无关于成本。

大厂们的抄，更多的也是其原有产品线与你说的个人开发者重合了，才抄的，而不是无条件的抄。而这种基于产品线的抄，有没有 AI ，大厂们都会抄，大不了收购嘛，个人开发者本身就没几个钱，对大厂来说其实没区别。有没有 AI 并不影响大厂们的决策。

况且我认为恰恰相反，AI 在肉眼可见的阶段里，仍然是提高下限，但难以提高上限的。

没有编程基础的人，可以编写一些简单的小应用、小程序。没有视频剪辑、拍摄基础的人，可以生成一些小短片。

但是对于提上限的工作，AI 是难以有所帮助的，比如把全行业的顶尖资料都喂给 AI ，他有机会设计出芯片嘛。

换而言之，就是让一些原本难以进入某些具有一定专业壁垒的领域人，现在可以在这些领域内有一些创作/表达，而原本就具有相关能力人，其创作效率得到了提高。

我认为是有利于中小，乃至个人开发/创作者。对于大厂来说，预算 1 万、10 万、50 万、100 万甚至 1000 万来尝试某个领域，其实完全没有任何区别，但是对于中小企业和个人，是存在巨大区别的。

某个创意的实施，如果需要 100 万，你可能就不干了，10 万的话，也许咬咬牙，你想要尝试一下，1 万的话，可能大概率就会试试了，博一个机会。

msg7086 · 2026-06-16 06:03

#15

@ntdll

但是对于提上限的工作，AI 是难以有所帮助的，比如把全行业的顶尖资料都喂给 AI ，他有机会设计出芯片嘛。难说。

假如我们可以假设，AI 的能力上限与人类相同（毕竟 AI 就是在用硬件去模拟真实的人类智力），那么人类能做到的 AI 没有理由做不到。设计芯片这种相对「简单」的工作对 AI 来说只会更简单。大部分同类工作对人类来说都是属于智力能及但时间精力不可及。比如编程，只要给你足够的时间去分析系统结构，调试运行状态，一个普通人也足够可以从零写出 Linux 内核，只不过这个人写到现在这个规模可能要花上几千年时间。我们现在谈及的大部分普通编程工作都是属于这类。芯片设计也一样，写个简单的电路不成问题，提升性能提升规模反复迭代才是花时间的地方。要是 AI 能以人类 100 倍的速度自己去迭代呢。

我倒是觉得现在芯片行业最难的还是在那些物理化学之类的工艺问题上。光刻胶，EUV ，如何制造出这些硬件设备，如何对抗这个宇宙的基本法则，这些才是 AI 搞不定的部分。

添加回复

你还需要登录后发表回复

登录后可发帖和回复

登录注册

主题信息

作者: LeeReamond

发布: 2026-06-16

点赞: 0

回复: 0