Apache Solr 入门

2025年3月17日 | 阅读 3 分钟

Solr 是一种针对独特问题的特定 NoSQL 技术。 Solr 是一个可扩展的、可随时部署的企业搜索引擎,旨在搜索大量以文本为中心的数据,并返回按相关性排序的结果。

Solr 由程序员 Yonik Seely 于 2004 年创建,用于为 CNET Network 的公司网站添加搜索功能。 2006 年 1 月,Apache solr 在 Apache 软件基金会的管理下成为一个开源项目。 Apache Solr 的最新版本是 8.6.2。

Getting started with Apache Solr

Apache Solr 正在积极开发中,并在当前主要版本上不断发布功能。 以前的重要版本偶尔会看到关键的安全或错误修复版本。 较旧的版本被认为是 EOL(生命结束),将不再更新。 因此,也可能难以获得 EOL 版本的社区支持。

搜索引擎基础知识

搜索引擎反映了大量互联网资源数据库,例如网页、新闻组、程序、图像等。要查找 WWW(万维网)上的信息,我们可以使用搜索引擎。

可以使用搜索引擎,方法是在搜索框中输入键盘或短语形式的查询。 当您按下 Enter 键时,它会搜索数据库并向用户返回相关链接。

Getting started with Apache Solr

搜索引擎的组成部分

搜索引擎由以下三个基本组件组成

网络爬虫: 也称为蜘蛛或机器人。 它是一个搜索 Web 以收集信息的软件组件。

数据库: Web 上的每一条信息都存储在数据库中。 它包含大量的 Web 资源。

搜索界面: 它是数据库和用户之间的界面。 它帮助用户浏览数据库。

搜索引擎的工作方式

搜索应用程序执行以下部分或全部操作以返回所需结果。

Getting started with Apache Solr

步骤 1: 任何搜索应用程序的第一步都是获取要进行搜索的原始内容。

步骤 2: 之后,从原始内容构建文档,这些文档易于任何搜索应用程序理解和解释。

步骤 3: 在开始索引之前,必须分析文档。

步骤 4: 创建并分析文档后,下一步是索引这些文档,以便可以基于某些键检索它们,而不是文档的全部内容。

步骤 5: 索引数据库准备就绪后,应用程序可以执行搜索操作。 为了帮助用户进行搜索操作,应用程序必须提供一个用户界面,用户可以在其中通过输入文本来启动搜索过程。

步骤 6: 在为文本创建搜索请求后,应用程序应该使用该文本准备一个查询对象。 查询对象可用于查询索引数据库以获取相关详细信息。

步骤 7: 构建查询对象后,即可使用它来获取相关详细信息和内容文档。

步骤 8: 获取所需结果后,应用程序应决定向其界面用户显示结果的方式。

在开始使用 solr 开发应用程序之前,我们必须让它在我们的本地计算机上运行。 它从 Apache 下载 Solr 8.6.o 的二进制发行版并解压缩下载存档开始。 有关 Solr 的完整安装过程,请切换到下一页。


下一个主题安装 Apache Solr