GoForum🌐 V2EX

OpenTalking 知识库功能实践:用开源实时数字人做一个景区导游

xuxin123122 · 2026-06-17 14:33 · 0 次点赞 · 0 条回复

最近我们在 OpenTalking 里加入了知识库能力,并做了一个景区数字人导游的 demo 。

OpenTalking 本身是一个开源实时数字人对话编排框架,主要负责把 LLM 、TTS 、STT 、WebRTC 、数字人驱动模型和前端交互串起来。之前它更偏“实时对话数字人”的基础链路验证,现在接入知识库后,可以开始承载一些更具体的业务场景。

这次 demo 里的思路比较直接:

准备景区相关资料,比如景点介绍、历史背景、游览路线、注意事项等。

将资料导入 OpenTalking 的知识库。

给数字人绑定对应知识库。

用户用自然语言提问。

系统检索相关知识片段,交给 LLM 组织回答。

再通过 TTS 和数字人驱动模型完成语音播报和口型/画面输出。

这样做的价值是,数字人不再只是套一个通用大模型聊天,而是可以基于一组明确资料回答问题。对于景区、展馆、博物馆、企业展厅、产品介绍等场景,这种方式会更接近实际落地需求。

知识库在这里主要解决三个问题:

回答内容可控:核心信息来自上传资料,而不是完全依赖模型自由发挥。

场景迁移方便:换一批资料,就可以从景区导游变成展馆讲解、产品顾问或课程助教。

数字人链路完整:检索、回答、语音合成、字幕和数字人画面可以在同一个系统里完成。

目前这个功能还在持续完善中,后续会继续补充文档管理、检索效果、引用展示、多知识库绑定、Persona 交付包等能力。

如果你也在做数字人、RAG 、企业知识库或多模态交互相关方向,欢迎交流和提建议。

0 条回复
添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: xuxin123122
发布: 2026-06-17
点赞: 0
回复: 0