GoForum › 🌐 V2EX

怎么实现纠正语音提取文字后的错别字、同音字，而不改变原文

richiewu · 2026-03-10 08:58 · 0 次点赞 · 3 条回复

试过两种路线，pycorrector 识别率稍微低 qwen 模型总是要改原文，怎么提要求都不行

3 条回复

kifile · 2026-03-10 09:03

增加 Workflow loop ，逻辑，搞一个比对脚本，QWEN 生成数据之后，必须经过一次比对脚本，不通过，那么将错误信息发回给 QWEN 重新生成，多次迭代。

想要进一步优化，就考虑切片，返回时给出变化内容行数信息，只调整对应行，做增量变更。

Meteora626 · 2026-03-10 09:18

错别字还能比对，同音字没有字库根本搞不定吧

richiewu · 2026-03-10 09:18

@Meteora626 大部分同音字大模型能搞定，因为有上下文

添加回复

你还需要登录后发表回复

登录后可发帖和回复

登录注册

主题信息

作者: richiewu

发布: 2026-03-10

点赞: 0

回复: 0