分辨率: 200-600dpi(不能超过600dpi识别)
识别率低的原因
1. 原稿不好。
例如原稿不清晰,断线,比较脏,有彩色底纹
2. 原稿倾斜
即使利用倾斜度调整功能,也会损失图象信息
方法: 尽量将原稿放正
3. 纸张太薄
纸张太薄,扫描时纸张背面的字会影响
方法: 选择文本增强模式进行扫描
4. 分辨率选择不当
方法: 建议选择300-400dpi
5. 字体太复杂
可识别的中文字体为:宋,黑,仿,楷
对其他的字体,例如隶书,魏碑,艺术字,手写体,识别率不高
6. 识别方向
扫描分区后,要根据实际情况,调整识别方向(横向或纵向)
7. 中英文选择
扫描分区后,要根据实际情况,选择中文/英文/图形进行识别
8. 简繁体选择
扫描分区后,要根据实际情况,选择中文简体,繁体和图形进行识别
与其他OCR软件的比较
英文: Omnipage比较好
中文: 与丹青,紫光企业版效果类似
识别率的比较
对各个OCR软件,没有统一的识别率比较测试或统一的测试样张。RosettaStone的识别率是通过扫描50万字统计出来的结果。
目前,各个OCR软件的识别率差别不大,注意上面几点都能得到较好的效果。