OCR 的全称是什么

2025年3月17日 | 阅读 3 分钟

OCR: 光学字符识别

OCR 是光学字符识别 (Optical Character Recognition) 的缩写。它也称为光学字符阅读器 (optical character reader, OCR) 或文本识别。它旨在将扫描的纸质文档或数字相机拍摄的文档图像转换为可读、可编辑和可搜索的数据。

OCR Full Form

纸质文档的扫描页面可以在屏幕上显示并可读,但对于计算机来说,它只是一系列黑白点,无法识别。为了让计算机能够读取扫描的文档并生成软拷贝,OCR 被开发出来。OCR 会检查扫描文档的文本,并将字符翻译成机器可读的代码,以便将其转换为电子格式或软拷贝,就像使用文字处理器创建的文档一样,用户可以编辑、格式化、搜索和阅读。

因此,它通过利用扫描页面或文档上印刷的文字和字符的光学特性,帮助计算机识别扫描页面或印刷或手写文档的数字图像中的单词和字符。

OCR 设备由硬件和软件组合而成,旨在将物理文档转换为机器可读文本。OCR 的硬件(光学扫描仪或电路板)负责复制和读取文本,而软件则负责高级处理。软件还可以利用人工智能来使用先进的智能字符识别 (ICR) 方法,例如识别语言或手写风格的能力。

OCR 的工作原理

  • 扫描仪处理文档的物理形式。
  • 文档扫描后,软件会分析其结构并将其转换为彩色(黑白)版本。
  • 扫描的文档会被检查,区分亮区和暗区。
  • 暗区被识别为字符,亮区被识别为背景。
  • 暗区会进一步分析以识别字母或数字。线条会被分割成单词,单词会被分割成字符。OCR 会尝试确定暗区是否代表特定的字母或数字。
  • 一旦字符被单独分离和识别,它们就会被转换为 ASCII 码,计算机系统可以使用该码进行进一步处理,从而呈现给您识别出的文本。

OCR 软件可能采用不同的技术,但通常一次分析一个字符、单词或文本块,然后使用以下两种算法之一来识别字符。

1) 模式识别:OCR 软件通过输入不同字体和格式的文本示例来开发,因此它们能够理解字符的形状或模式,并相应地正确识别它们。

2) 特征检测:在此技术中,OCR 程序依赖于字符或数字的特征。特征可能包括字符中斜线的数量、交叉线或曲线。例如,字母“A”可以存储为两条线,在中间连接一条水平线,并且两端连接在一起。


下一个主题全称