GoForum🌐 V2EX

怎么实现纠正语音提取文字后的错别字、同音字,而不改变原文

richiewu · 2026-03-10 08:58 · 0 次点赞 · 3 条回复

试过两种路线,pycorrector 识别率稍微低 qwen 模型总是要改原文,怎么提要求都不行

3 条回复
kifile · 2026-03-10 09:03
#1

增加 Workflow loop ,逻辑,搞一个比对脚本,QWEN 生成数据之后,必须经过一次比对脚本,不通过,那么将错误信息发回给 QWEN 重新生成,多次迭代。

想要进一步优化,就考虑切片,返回时给出变化内容行数信息,只调整对应行,做增量变更。

Meteora626 · 2026-03-10 09:18
#2

错别字还能比对,同音字没有字库根本搞不定吧

richiewu · 2026-03-10 09:18
#3

@Meteora626 大部分同音字大模型能搞定,因为有上下文

添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: richiewu
发布: 2026-03-10
点赞: 0
回复: 0