Description 现象
用户口述开发语境内容时,明显错误的 ASR 文本仍会进入最终输出。例如用户说“提交 issues / 这些 issue”,最终可能被整理成 iOS。
用户期望 polish 阶段根据本段上下文判断词语是否识别准确,自动修正语音输入中的易错词,而不是把明显错误原样输出。
这次具体场景里,用户要求把若干问题“提交 issues”,但输出没有可靠保留 issue/issues 语义,甚至会把 issue 误判成 iOS。
代码证据
openless-all/app/src-tauri/src/polish.rs:415 明确要求不引用“项目上下文、外部知识或模型记忆”。这能避免幻觉,但也削弱了开发语境下纠正 issue / iOS 这类同音或近音误识别的能力。
openless-all/app/src-tauri/src/polish.rs:420 要求“中英混输、专有名词、产品名、代码 / 命令 / 路径 / URL、数字与单位、emoji 原样保留”。如果 ASR 已经把 issue 错成 iOS,这条规则会诱导模型保留错误结果。
openless-all/app/src-tauri/src/polish.rs:196 的热词注入措辞是“仅当原始转写明显是其误识别时才纠正”,和 feat: polish 提示词词汇本注入措辞调整 — 当前太保守 #63 的问题一致,整体偏保守。
openless-all/app/src-tauri/src/coordinator.rs:616-617 中 ASR raw transcript 直接进入 polish,没有独立的上下文纠错步骤。
影响
开发者口述 GitHub / CI / issue / PR / tag 等内容时,最终文本会出现八竿子打不着的词,降低语音输入可信度。
用户把 OpenLess 输出直接发给 AI 或粘贴到 GitHub 时,会把错误词带进后续工作流。
该问题会让“清晰结构”模式看起来结构正确,但关键术语错误,风险比普通错别字更高。
建议接受标准
TODO / 不确定项
需要确认主要修复放在 prompt、LLM 前置纠错层,还是二者结合。
需要补充更多真实 ASR 错词样本,例如 CI、PR、tag、release、workflow 等开发词汇。
Reactions are currently unavailable
You can’t perform that action at this time.
现象
iOS。issue/issues语义,甚至会把issue误判成iOS。代码证据
openless-all/app/src-tauri/src/polish.rs:415明确要求不引用“项目上下文、外部知识或模型记忆”。这能避免幻觉,但也削弱了开发语境下纠正issue/iOS这类同音或近音误识别的能力。openless-all/app/src-tauri/src/polish.rs:420要求“中英混输、专有名词、产品名、代码 / 命令 / 路径 / URL、数字与单位、emoji 原样保留”。如果 ASR 已经把issue错成iOS,这条规则会诱导模型保留错误结果。openless-all/app/src-tauri/src/polish.rs:196的热词注入措辞是“仅当原始转写明显是其误识别时才纠正”,和 feat: polish 提示词词汇本注入措辞调整 — 当前太保守 #63 的问题一致,整体偏保守。openless-all/app/src-tauri/src/coordinator.rs:616-617中 ASR raw transcript 直接进入 polish,没有独立的上下文纠错步骤。影响
建议接受标准
issue/issues,不能输出为iOS。iOS仍应保留为iOS,不能机械替换成issue。issuevsiOS增加 prompt 级或单元级回归用例,覆盖中文口述和中英混输。TODO / 不确定项