GoForum › 🌐 V2EX
怎么实现纠正语音提取文字后的错别字、同音字,而不改变原文
richiewu ·
2026-03-10 08:58 ·
0 次点赞 · 3 条回复
试过两种路线,pycorrector 识别率稍微低 qwen 模型总是要改原文,怎么提要求都不行
3 条回复
Meteora626 · 2026-03-10 09:18
错别字还能比对,同音字没有字库根本搞不定吧
@Meteora626 大部分同音字大模型能搞定,因为有上下文
添加回复
你还需要 登录
后发表回复
增加 Workflow loop ,逻辑,搞一个比对脚本,QWEN 生成数据之后,必须经过一次比对脚本,不通过,那么将错误信息发回给 QWEN 重新生成,多次迭代。
想要进一步优化,就考虑切片,返回时给出变化内容行数信息,只调整对应行,做增量变更。