Java OCR17 Mar 2025 | 6 分钟阅读 什么是 Tesseract OCR?Tesseract OCR 是由 HP 实验室于 1985 年开发、2005 年推出的光学字符识别引擎。自 2006 年以来,一直由 Google 开发。Tesseract 支持 Unicode (UTF-8),可以“开箱即用”识别 100 多种语言,因此可用于创建不同语言的扫描软件。Tesseract 的最新版本是 Tesseract 4。它增加了一个新的基于 OCR 的神经网络 (LSTM) 引擎,专注于行识别,但也支持通过识别字符模式工作的 Tesseract OCR 传统引擎。 随着人工智能和机器学习的飞速发展,我们现在需要严格的图像处理。它使我们能够在 Java 中执行此类处理。 OCR 如何工作?Tesseract OCR 可在 Windows、Mac 和 OS 等所有主要操作系统上下载。要了解 OCR 的工作原理,请按顺序考虑以下步骤:
如何使用 Tesseract OCR?要在 Java 中使用 Tesseract OCR,请按照以下步骤操作:
jar 文件已成功链接到项目,因此 Tesseract 引擎已准备好使用。 对清晰的图像执行 OCR现在我们已经链接了 jar 文件,我们可以开始编码部分了。以下代码读取图像文件并执行 OCR,并在控制台上显示文本。 OCR.java 输入 image.jpg ![]() 输出 Sometimes, this simply isn't possible. Sometimes, we wish to automate a task of rewriting text from an image with our own hands. 使用 OCR 读取不清晰的图像请注意,上面选择的图像分辨率非常高,字体一致,但这在大多数情况下不会发生。在大多数情况下,我们会得到一个不清晰或可能失真的图像,从而导致失真的输出。为了解决这个问题,我们需要对图像执行一些称为图像处理的步骤。 Tesseract 在文本与背景的分割非常清晰时效果最佳。事实上,确保良好的分离可能非常具有挑战性。如果图像具有不清晰或失真的背景,则可能无法获得 Tesseract 的高质量输出,原因有很多。在这种情况下,我们需要知道图像应该如何处理。 在这里,我们将创建一个小型智能模型,该模型将扫描图像的 RGB 内容,将其转换为灰度,并再次创建缩放效果。 下面的示例是根据 RGB 内容对图像进行灰度处理的示例代码。 ReadingImage.java 输入 ![]() 输出 Time taken to search elements keep increasing as the number of elements were increased. 优点OCR 的优点如下:
缺点OCR 的缺点如下:
下一个主题Java 中的对象定义 |
Java 中的 IdentityHashMap 类 IdentityHashMap 类类似于 HashMap 类。它实现了 AbstractMap 类。然而,它在比较键(或值)时使用引用相等性而不是对象相等性。它不是 Map 的通用实现。虽然此类实现了...
阅读 12 分钟
在 Java 中,接口变量和枚举都用于定义常量,但它们用于不同的目的。接口变量 在 Java 中,接口内声明的所有变量都隐式地是 public、static 和 final。这意味着它们是属于接口本身的常量,...
5 分钟阅读
拼写检查器是文本处理应用程序的重要组成部分,其中会使用字典验证每个单词的正确性,并在出现拼写错误时建议正确的文本拼写。在本节中,我们将解释如何改进……
阅读9分钟
Eclipse 是开发人员最常用和最受欢迎的 IDE 之一。它具有开箱即用的功能,使其在其他 IDE 中脱颖而出。有多种因素会影响我们有效和高效地编写代码的能力。从由 AI 驱动的代码补全辅助到...
阅读 2 分钟
由相同数字非平凡地组成的偶数称为 Zygodrome。这意味着如果相同的数字总是成对地出现在数字中,那么该数字就称为 Zygodrome。Zyg 是一个希腊词,意思是联合或...
5 分钟阅读
在 Java 中,垃圾回收是一种提供自动内存管理的机制。它由 JVM 完成。程序员无需处理对象的分配和释放。在之前的章节中,我们还讨论了垃圾回收的工作原理。如果您还不熟悉…
5 分钟阅读
给定两个整数 P 和 Q。任务是找出系列的总计数,其中当前元素是系列中上次出现的元素的双倍或两倍以上,并且该系列中的任何元素都不能...
阅读 12 分钟
在 Java 编程中,包是用于组织类、接口和其他相关资源的容器。它们提供了一种将相关代码分组在一起的方法,有助于创建模块化且可维护的应用程序结构。虽然包本身对于组织代码至关重要,但 Java...
阅读 3 分钟
我们已经熟悉 JUnit 测试框架。它用于在 Java 中执行单元测试。JUnit 测试用例是一组代码,用于确保我们的程序代码是否按预期工作。JUnit 是 Java 中广泛使用的测试框架……
阅读 4 分钟
在 Java 中,图形用户界面 (GUI) 在创建交互式应用程序方面起着至关重要的作用。GUI 编程的关键方面之一是布局管理器,它决定了组件如何在容器内排列。边框布局管理器就是这样一种布局管理器,它简化了...
阅读 4 分钟
我们请求您订阅我们的新闻通讯以获取最新更新。
我们提供所有技术(如 Java 教程、Android、Java 框架)的教程和面试问题
G-13, 2nd Floor, Sec-3, Noida, UP, 201301, India