GoForum🌐 V2EX

关于我做了一个自嗨的语音助手,愿景是小白也能通过自然语言轻松操控电脑或手机(跪求大佬指点)

jayn1985 · 2026-04-22 21:25 · 0 次点赞 · 3 条回复

因为市面上没有一个真正好用的语音助手,帮助我释放双手,并且现在主流的智能体助手,像豆包,Gemini 等,因为过于通用化而显得有时候很弱智和胡说八道,也出于对童年魔幻手机里的傻妞这样的人工智能的憧憬,所以自嗨了一个语音智能体

这个智能体能够记得我上次的对话,熟悉我的情绪,不会一味的附和我,甚至在我偷懒提问时直接“怼”我,引导我独立思考,会不会组成一个真正的伙伴

它能够扮演任何角色,导师,朋友,商业精英等等(计划中)

它还能根据对话推理你下达的任务与期望的目标

它能经过同意,操控电脑或手机,如清理垃圾,打开应用,使用应用(下单淘宝购物,剪辑视频)(计划中,成本爆炸)

现阶段已完成一部分,暂时没放服务器里

目前一个人/小团队全栈开发,有些技术方案可能是“能跑就行”,跪求大家多提意见(啥意见都行):

关于记忆的 TTL 和置信度算法:目前是基于规则的简单衰减,在大佬做长期记忆检索( RAG )时,有没有更轻量、更智能的本地管理或图数据库推荐?

IPC 通信的流畅性:Node.js 和 Python 之间传音频目前采用了“传本地文件路径 + TCP Socket 传 JSON”的方案,感觉还是有点,有没有更好的本地跨进程通信最佳实践?

在 MVP 阶段,大佬们觉得哪些功能是伪需求,应该断断续续聚焦核心吗

3 条回复
cpstar · 2026-04-22 21:35
#1

你说的可是 openclaw+遥控器 skill ?

亦或者是粗粮或者水果乃至遥遥领先的全家桶?

cpstar · 2026-04-22 21:35
#2

不好意思,想成家电了。

但是遥控电脑和手机,不更是虾或者马么

jayn1985 · 2026-04-22 22:25
#3

@cpstar 哈哈,看到”遥遥领先“”笑死了 确实,论复杂的系统级编排、生态丰富度以及沙箱隔离机制,虾和马 已经是目前的行业标杆。现在做桌面自动化,基本绕不开这两座大山。 但虾 和 马 部署门槛太高了(重度依赖 Docker 隔离和技能权限配置),而我的定位并非对标重型自动化框架,而是探索低门槛 + 情感化的本地桌面级交互 是不是太过异想天开了

添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: jayn1985
发布: 2026-04-22
点赞: 0
回复: 0