Selasa, 24 Januari 2017

定义OCR


OCR是那些光学字符识别,也可在西班牙被称为光学字符识别. OCR软件是一个 使文字识别,产生了这样的一个图像,以将其转换成字符继承,来存储它们在给定的格式,它可以在程序被用于文本编辑. 是由于这种新技术可以将任何文本或文件,其包括PDF文件,扫描纸张或甚至从数码相机拍摄的图像,作为数据,以便能够进行编辑.

该软件的工作原理如下,首先分析了问题文档的图像的每一部分;分布在象表格,图像,文本块,等等件页;那么线ESTN分布于文字变得字符后;并且由于字符已经sealados,该软件使得与一组图形图像的比较. 这一系列的进展,根据假设,其中的每一个字符是 ;和在这些假设basndose将分析线成单词的断裂的不同变型和词语成字符. 它是经过大量的分析和假说的处理,该程序最后呈现已确认,并用新的格式 变换文本.

Cabe指出,现在给出了若干方案,市场提供基于informtico OCR等的OmniPage,ABBYY精细Reader或Readiris中. YY具有不仅分析和识别的文本本身,但除了识别格式和风格,但具有一定的局限性,需要作为文本的能力,被分析之后,它被编辑作出调整按要求.



.

Tidak ada komentar:

Posting Komentar