文件列表:
Mobidev:光学字符识别技术报告【英文版】.pdf |
下载文档 |
资源简介
>
什么是 OCR,它是如何工作的?光学字符识别(OCR),也称为文本识别技术,即将任何类型的包含书面文本的图像转换为机器可读的文本数据。OCR可以快速自动地使文档数字化,而无需手动输入数据。这就是为什么OCR通常用于业务流程优化和自动化的原因。OCR的输出进一步用于电子文档编辑和压缩数据存储,还构成了认知计算、机器翻译和文本到语音技术的基础。根据解决的任务有不同类型的 OCR:智能文字识别(IWR)用于识别不受约束的手写文字,而不是识别单个字符。智能字符识别(ICR)是一种更高级的OCR形式,它基于更新算法收集更多关于手写字符变化的数据。光学文字识别(OWR)逐字扫描文字。光学标记识别(OMR)用于识别人们在调查、测试等标记的信息。传统的光学字符识别系统功能包括三个阶段:图像预处理、字符识别、后处理。1、检查文档类型和图像预处理文本识别的主要挑战是每个文档模板都有自己的一组实体、值和实体在文档中的位置。要使OCR软件准确运行,它必须能够识别不同类型的文档并在此基础上运行正确的预定义管道。选择正确的管道后,图像进入预处理步骤。2、字符识别通过使用特征检测和模式识别算法,可以检测到单个字符。
加载中...
已阅读到文档的结尾了