插值查找 vs 二分查找

17 Mar 2025 | 5 分钟阅读

搜索是需要在不同数据集上执行的常见任务。在当今快速发展的世界中，我们总是希望节省时间。高效的搜索算法可以帮助我们进行高效的搜索。

二分查找和插值查找是两种流行的搜索算法，它们在方法和效率上有所不同。

在本文中，我们将深入探讨二分查找和插值查找之间的主要区别，并讨论在特定搜索中应优先选择哪种算法。

二分搜索

二分查找是一种经典的有序数组搜索算法。

它通过不断将搜索空间减半，利用分治技术，直到找到目标元素或搜索空间为零。

该算法可总结如下：

从整个已排序的数组开始。
计算数组的中间索引。
如果中间索引处的元素与目标匹配，则搜索成功。
如果目标小于中间元素，则在数组的左半部分重复该过程。
如果目标大于中间元素，则在数组的右半部分重复该过程。
持续此过程，直到找到目标元素或搜索空间变为空。

下面是二分查找的 Python 实现

# Defining the Binary Search Algorithm - Iterative Method 
def binarySearch(arr, k):
    n = len(arr)

    # Set the initial left and right boundaries
    left = 0
    right = n - 1

    # Perform binary search until the left and right boundaries meet
    while left <= right:

        # Calculate the middle index
        mid = (right - left) // 2 + left

        # Check if the middle element is equal to the search key (k)
        if arr[mid] == k:
            # If found, return the index of the middle element
            return mid
        
        # If the middle element is greater than the search key,
        # narrow the search range to the left half of the array
        elif arr[mid] > k:
            right = mid - 1

        # If the middle element is smaller than the search key,
        # narrow the search range to the right half of the array
        else:
            left = mid + 1
            
    # If the search key is not found in the array, return -1
    return -1

对于大型数据集，二分查找非常高效，因为它在每一步都会消除剩余搜索空间的一半。

时间复杂度：O(log n)，其中 n 是数组中的元素数量。

但是，它要求数组按升序或降序排序，对数组的任何更改都可能需要重新排序。

插值查找

插值查找是二分查找的改进，当数据集中的元素分布均匀时，它效果很好。

它使用公式化方法来确定目标元素在数组中的位置。

插值查找算法可总结如下：

从已排序的数组开始。
使用基于数组中最小值和最大值的公式估算目标元素的位置。
如果估计的位置与目标匹配，则搜索成功。
如果目标小于估计的元素，则在数组的左半部分重复该过程。
如果目标大于估计的元素，则在数组的右半部分重复该过程。
持续此过程，直到找到目标元素或搜索空间变为空。

下面是插值查找的 Python 实现

# Interpolation Search Algorithm
def interpolation_search(arr, target):
    
    low = 0  # Starting index
    high = len(arr) - 1  # Ending index

    while low <= high and arr[low] <= target <= arr[high]:
        if low == high:
            if arr[low] == target:
                return low
            return -1

        # Estimate the position of the target element using interpolation formula
        pos = low + ((target - arr[low]) * (high - low)) // (arr[high] - arr[low])

        if arr[pos] == target:
            return pos
        elif arr[pos] < target:
            # Search in the right portion of the array
            low = pos + 1
        else:
            # Search in the left portion of the array
            high = pos - 1

    # If the search key is not found in the array, return -1
    return -1

# Example usage:
sorted_list = [2, 4, 7, 9, 12, 15, 18, 20, 23, 25]
target_element = 15

result = interpolation_search(sorted_list, target_element)

if result != -1:
    print("Element found at index:", result)
else:
    print("Element not found")

输出

当数据集分布均匀时，插值查找可能比二分查找更有效，因为它会估算目标元素的位置，而不是将搜索空间减半。

但是，如果数据集分布不均匀，插值查找的性能可能不如二分查找。

插值查找的时间复杂度取决于数据集，平均约为 O(log log n)，在数据集分布不均匀的情况下，最坏情况下的时间复杂度为 O(n)。

插值查找比二分查找好吗？

插值查找是否优于二分查找取决于被搜索数据集的特征。

以下是比较这两种算法时要考虑的两个因素：

因素	插值查找	二分搜索
数据集分布	当数据集分布均匀时，插值查找的性能更好。它根据数组两端的数值来估算目标元素的位置。	另一方面，二分查找始终将搜索空间减半，而不管数值的分布如何。
时间复杂度	插值查找的平均时间复杂度为 O(log log n)。但是，在最坏情况下，插值查找的性能可能会下降到 O(n)，这比二分查找慢。	二分查找的时间复杂度为 O(log n)。

何时使用插值查找和二分查找

插值查找和二分查找之间的选择取决于被搜索数据集的特征。

以下是选择合适算法的一些技巧：

使用二分查找时：

数据集大且分布均匀。
数据集已排序且是静态的（即，它不经常更改）。
内存使用需要最小化，因为二分查找只需要索引数组。

使用插值查找时：

数据集大且分布均匀。
数据集已排序且是动态的（即，它经常更改）。
数据集按非均匀分布排序，但表现出一定程度的线性。

插值查找和二分查找之间的主要区别

因素	插值查找	二分搜索
方法	插值查找根据数据集的分布估算目标元素的位置。	而二分查找遵循分治策略，在每一步将搜索空间减半。
*时间复杂度*	平均情况：O(log logn) 最坏情况：O(n)	平均情况：Θ(logn) 最坏情况：O(logn)
*数据集分布*	插值查找需要排序的数据和均匀的分布。	二分查找需要排序的数据。
*静态和动态*	插值查找可以更有效地处理动态数据集。	而二分查找更适合静态数据集。

结论

总之，二分查找和插值查找都是重要且有价值的搜索算法，具有独特的优势。

对于已排序、静态的数据集，二分查找是可靠的选择，而对于已排序、动态或分布均匀的数据集，插值查找则表现出色。

了解数据集的特征并考虑时间复杂度的权衡将有助于在这些搜索算法之间做出明智的选择。

下一个主题Boggle（在一个字符板中查找所有可能的单词）

← 上一个下一个 →

插值查找 vs 二分查找

二分搜索

插值查找

插值查找比二分查找好吗？

何时使用插值查找和二分查找

插值查找和二分查找之间的主要区别

结论

联系信息

关注我们

教程

面试题

在线编译器

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

数据结构教程

DS 数组

DS 链表

DS 栈

DS 队列

DS 树

DS 图

DS 搜索

DS 排序

哈希与堆

差异

二叉树

二叉搜索树

AVL 树

单向链表

双向链表

循环链表

循环双向链表

DS 选择题

其他

插值查找 vs 二分查找

二分搜索

插值查找

插值查找比二分查找好吗？

何时使用插值查找和二分查找

插值查找和二分查找之间的主要区别

结论

相关帖子

通用树 (N 元树)

线图

线段树 (带节点更新的范围最大查询)

数据结构中的时间复杂度

将所有零移到数组末尾

股票收益问题

链表应用、优点和缺点

DS 中的二叉树遍历

长度为 K 的子串中元音数量最多的子串

第 k1 小和第 k2 小元素之间的所有元素之和

订阅 Tpoint Tech

联系信息

关注我们

教程

面试题

在线编译器