claude code 实践心得:飘才是最大的敌人
现在基本都是 100% cc 写代码了。也用过 superpowers 之类的牛逼哄哄的 skill 。现在基本每几天就能看到一个自动做 multi-agent 项目的框架,skill ,产品,都疲劳了。个个描述的都很科幻,启动一堆机器人帮你干活,你就一边歇着去。具体使用起来的感受一言难尽。发现都是等几个小时,然后写出来是一个 UI 看起来确实是我刚刚开始说的东西,但是内部是一坨
而且这些 multi-agent 框架现在都在比谁更智能,使用者可以完全不用动。但是程序员是不喜欢这种感觉的,程序员是喜欢透明的。因为我们知道天上不会掉馅饼。低代码框架这么多年也没推开,就是因为那玩意做个简单的不怎么改的小网站,小商城确实是可以。但是你要放公司层面这么搞,最后改 bug 的不还是自己。
我觉得现在 ai 编程最大的问题就是模型会飘,就跟游戏传声筒一样,最后一个人复数出来的话跟第一个人说的完全对不上。如果你启动一个 agent 它可能飘 1 步,你启动多个 agent ,agent 跟 agent 还是上下游关系的话,最后,飘到 100 步开外都不止
用 muti-agent 的场景是什么?我很好奇。 在 ui 这里,是多个 agent 同时设计不同的页面吗?
@lolo1 是啊,而且宣传的例子都差不多,开头就是一句“我想做一个网上商城”然后模型就 ask 你要怎么做啊,要什么架构啊,然后生成一份超长的 SPEC ,然后吭哧吭哧的开始干。
但是哪家程序员是这么干活的。我们不可能从 0 开始做一个网上商城。我们都是在维护一个已经用了很多年的系统,然后每天从 jira 上拿 ticket 下来做。每个 ticket 基本都是给这个购物车加个 xxx 功能。给用户评论加个啥之类的,偶尔会来个大的,比如加个新的模块,这就够大了。
当然你可以把小 ticket 丢给 superpowers ,它也可以帮助拆解,然后丢该子 agent 。但是我发现这就是杀鸡用牛刀,写出来的还是一坨,我只能打断它让它不要去提交代码,我先看一遍。然后发现这都没必要用这玩意。直接把 ticket 用 cc 自己分析一下,然后让 cc 写完别提,然后自己审核一下,虽然慢,但是之前 superpowers 写的那是啥玩意。
@wonderfulcxm 就是需求拆解,然后去做
我觉得现在 ai 编程最大的问题就是模型会飘,就跟游戏传声筒一样,最后一个人复数出来的话跟第一个人说的完全对不上。如果你启动一个 agent 它可能飘 1 步,你启动多个 agent ,agent 跟 agent 还是上下游关系的话,最后,飘到 100 步开外都不止
本质在于 LLM 的输出即思维。这是一个类似不确定性原理的模型 —— 想要观测模型思维就必须让它输出,想让它输出就必须先有输入,有输入就会干扰其输出权重。结果就是,你无法同时获得( LLM 对概念的精确理解|LLM 对概念的自主思考)。这两个共轭量的「乘积」整好反应了模型的底层实力,有这个基本原理存在决定了不可能用外部治理的手段把模型能力提升到更好模型的水平。
个个描述的都很科幻,启动一堆机器人帮你干活,你就一边歇着去
但凡做过真实产品的人都知道这「从信息论的意义来说」就不可能。所以自动化 agent 产品的核心价值在于怎样定义最适合 agent 发挥,同时人类能最好、最简单掌控局面的协作模式。其实绝大多数产品都没在尝试除了「让 AI 根据 prompt 放手干」之外的模式,效果必然都在同一个不尽如人意的水平上晃荡。
@GeruzoniAnsasu 共轭量的「乘积」。我去,专业人员
@GeruzoniAnsasu 确实是,我就觉得这不可能嘛,我自己都知道我给的信息不全,它是怎么做出来的,无中生有
@xialaoban 我一直觉得 agent 自己 review 自己是一个骗局。agent 它写的代码没有小问题只有大问题。开另一个 agent 来审核,大问题它又看不出来,小问题不用它看。纯浪费 token
@ximaoyang https://docs.piebald.ai/ 这个也许有点意思,可以尝试尝试。 我看了几个功能挺不错的,我也刚上手。 Agent rules Permission modes Pausing the agentic loop Context management Subagents Tool calls + Builtin tools Default system prompt Using @pierre/diffs for file edit diffs ✓ Branching
工具我觉得也就这极限了,llm 底层结构决定了漂移的必然性。
多 agent 会失真 其中一个原因就是子 agent 没有足够主需求的 prompt 。然后,AI 的本质其实是文字的概率、他们并不理解,所以还是要提示词工程。
复议,所以不明白为啥很多人还在开发什么基于角色的流程 agent ,毫无意义。信息在传递过程会无限失真,一个 cc 能搞定就不要用多个乱七八糟的 agent