描述
目前项目只支持基于 ONNX Runtime 的 PaddleOCR 模型进行文字识别。为了提供更多样化的选择以及在某些语言上获得更稳定的识别率,计划在未来引入 Google ML Kit (Text Recognition v2) 作为可选的 OCR 引擎。
理由
目前 PaddleOCR 移动端模型的缺点:
- 对竖排日文文本识别效果一般,移动端模型识别时经常漏掉舍假名;
- PaddleOCR 将横竖文本混在一起训练,例如偶尔将「い」认成「二」;
- 对 Emoji 识别效果差,颜文字等特殊符号也同样如此;
添加新模型的好处:
- 不占用太多体积:在 Android 设备上可以通过 Google Play Services 动态加载;
- 多语言支持:v2 版本对中、日、韩、拉丁语系的识别精度不错,支持自动语言检测;
- 更好的布局分析:提供 Text -> TextBlock -> Line -> Element 层级结构,有助于优化目前的排版逻辑;
计划
为了支持 ML Kit,需要在未来的开发中考虑以下几点:
数据结构适配:
GPL 兼容性声明:
- 采用 Google Play Services 版本的 ML Kit,并确保主程序代码保持 GPLv3 开源,在 README 中明确相关依赖的授权说明;
相关资源
描述
目前项目只支持基于 ONNX Runtime 的 PaddleOCR 模型进行文字识别。为了提供更多样化的选择以及在某些语言上获得更稳定的识别率,计划在未来引入 Google ML Kit (Text Recognition v2) 作为可选的 OCR 引擎。
理由
目前 PaddleOCR 移动端模型的缺点:
添加新模型的好处:
计划
为了支持 ML Kit,需要在未来的开发中考虑以下几点:
数据结构适配:
GPL 兼容性声明:
相关资源