使用 Python 进行 Google 搜索包

2024 年 8 月 29 日 | 4 分钟阅读

在本教程中,我们将学习 Python 中当前可用的 Google 搜索包。我们将了解最常用的 Google 搜索库的用法。我们还将学习如何使用 Python 代码在 Google 上进行搜索查询。Python 提供了许多用于 Google 搜索的库,但它们的文档相当复杂且写得很糟糕。本教程将指导您如何以简单的方式使用 Google 搜索库。

让我们介绍一下库。

Google 搜索

Google 是全球最受欢迎和使用最广泛的搜索引擎。它能在几毫秒内解锁来自互联网各个角落的信息。在过去的 20 年里,我们一直依赖标准方法来查询从新闻文章到研究主题的各种信息。搜索互联网的两个主要原因是:

  • 使用 Stack Overflow 解决问题
  • 数据挖掘

数据挖掘是从大型数据集中提取新信息或见解。从互联网挖掘数据的方法称为网络挖掘。网络挖掘可分为三个部分:网络内容挖掘、网络使用挖掘和网络结构挖掘。

检索数据首选的网络挖掘方法是使用 Google 搜索来检索用于抓取目的的 URL。出于本文的目的,我们暂时只关注 URL 检索过程。

要使用 **google** 库,我们需要安装 google 库。我们将使用以下示例:

现在我们将执行基本的搜索操作。例如,搜索公司 **“Apple”** 和主题 **“iPhone”** 来检索新闻文章。

输出

https://en.wikipedia.org/wiki/The_Matrix_(franchise)
https://en.wikipedia.org/wiki/The_Matrix
https://en.wikipedia.org/wiki/The_Matrix_Resurrections
https://en.wikipedia.org/wiki/The_Matrix_Revolutions
https://en.wikipedia.org/wiki/Neo_(The_Matrix)
https://en.wikipedia.org/wiki/The_Matrix_(franchise)#Films
https://en.wikipedia.org/wiki/The_Matrix_(franchise)#Cast_and_crew
https://en.wikipedia.org/wiki/The_Matrix_(franchise)#Reception
https://en.wikipedia.org/wiki/The_Matrix_(franchise)#Influences_and_interpretations
https://www.warnerbros.com/movies/matrix
https://www.imdb.com/title/tt0133093/
https://www.youtube.com/watch?v=vKQi3bBA1y8
https://www.youtube.com/watch?v=9ix7TUGVYIo
https://www.matrixcomsec.com/
https://www.britannica.com/science/matrix-mathematics
https://www.amazon.com/Matrix-Keanu-Reeves/dp/B000GJPL1S
https://www.matrix-globalservices.com/
https://www.matrix.in/
https://matrix.org/
https://www.matrixres.com/
https://dictionary.cambridge.org/dictionary/english/matrix
https://www.matrixpartners.in/
https://en.wiktionary.org/wiki/matrix
https://www.merriam-webster.com/dictionary/matrix
https://www.rottentomatoes.com/m/matrix
https://www.matrixaccesscontrol.com/
https://mathworld.net.cn/Matrix.html
https://www.dictionary.com/browse/matrix
https://www.netflix.com/in/title/20557937

上面的代码将显示 Google 上与 Matrix 相关的所有 URL。您可以手动进行 Google 搜索并验证结果。上面的函数接受以下参数:

  • query - 这是我们想在 Google 上搜索的字符串。
  • tld - 它代表顶级域,这意味着我们想在 google.com、google.in 或其他域名上搜索我们的结果。
  • lang - 它代表语言。
  • num - 它显示我们想要的结果数量。
  • start - 要检索的第一个结果。
  • stop - 要检索的最后一个结果。如果我们传递 None,它将永远搜索。
  • pause - 它显示 HTTP 请求之间等待的时间间隔。如果间隔太短,Google 可能会阻止 IP。保持较长的间隔会减慢您的程序,但这是一个安全且更好的选择。
  • Return - 它会迭代找到的 URL。如果 stop 参数为 None,则迭代器将无限循环。

要了解 **googlesearch** 库的源代码和更多详细信息,您可以访问官方 仓库。

Google API

Google API 是一个 Python 库,用于高效地执行 Google 搜索。它的工作方式与其他 Google 库类似;它从 Google 抓取数据。

注意 - 不建议多次运行,因为它涉及抓取。

要安装此库,请在终端中使用以下命令。

现在,让我们使用 googlesearchapi 进行一些简单的搜索。

示例 -

输出 -

[GoogleResult(name=Taylor Swift | Homewww.taylorswift.com description=taylor swift - willow (official music video) RsEZ.., GoogleResult(name=Taylor Swift - Wikipediaen.wikipedia.org > wiki > Taylo.. 
description=Taylor Alison Swift (born December 13, 1989) is a.., 
GoogleResult(name=Taylor Swift (@taylorswift) * Instagram photos and vide.. 
description=142.1m Followers, 0 Following, 486 Posts - See In.., 
GoogleResult(name=Taylor Swift - Home | Facebookwww.facebook.com > ... > .. 
description=Taylor Swift. 70978350 likes * 788642 talking abo.., 
GoogleResult(name=Taylor Swift | Billboardwww.billboard.com > music > tay.. 
description=Not content to merely be a country superstar, Tay.., 
GoogleResult(name=Taylor Swift: Evermore review - a songwriter for the ag.. 
description=10 hours ago -- Swift is a songwriter for the ages.., 
GoogleResult(name=Taylor Swift on Spotifyopen.spotify.com > artist description=Taylor Swift, Category: Artist, Albums: evermore,..]

googleapi 不仅会显示源链接,还会附带名称和描述作为结果。根据开发人员的说法,该库仍处于开发阶段;更多功能即将推出。

货币转换

googlesearchapi 还允许我们转换货币。这意味着我们可以通过 Python 代码使用货币转换器。让我们通过以下示例来理解:

示例 -

输出

5.0 USD = 397.55 rupees

您可以用其他货币进行尝试。

结论

本教程包括两个重要的 Google 搜索 API 库。使用这些 API,我们可以使用 Python 代码搜索查询。您可以自由探索这些库并根据需要使用它们。本教程的目的是让您熟悉 Google 搜索库。