Python 中有效的根搜索算法

2025年3月17日 | 阅读13分钟

作为数据科学家和计算机科学家，我们经常在日常工作中处理求根算法，即使我们没有意识到。这些算法旨在定位特定值、局部/全局最大值或最小值的邻近区域。

我们使用求根算法来搜索特定值、局部/全局最大值或最小值的邻近区域。

在数学中，求根通常意味着我们试图求解像 f(X) = 0 这样的方程组。这将使求根算法成为一种非常有效的搜索算法。我们所要做的就是定义 g(X) = f(X) - Y，其中 Y 是搜索目标，然后求解 X，例如 g(X) = f(X) - Y = 0。

这些方法主要分为两大类：

区间逼近法（例如，二分法）
迭代法（例如，牛顿法、割线法、Steffensen 法等等）

在接下来的教程中，我们将了解其中一些算法在 Python 编程语言中的实现，并进行比较。这些算法包括：

二分法
假位法
伊利诺伊算法
割线法
Steffensen 算法

在开始之前，我们假设有一个连续函数 f，并且想要搜索一个值 y。因此，我们正在求解方程：f(x) - y = 0。

理解二分法

二分法，也以其离散版本（二分搜索）或树变体（二叉搜索树）而闻名，是一种在给定范围内搜索目标值的有效算法。因此，这种算法也被称为求根的区间逼近法。

主要优点

二分法是一种鲁棒的算法，可以保证以合理的收敛速度接近目标值。

主要缺点

该算法需要了解根的估计区域。例如，3 ≤ π ≤ 4。
该算法只有在估计区域内只有一个根时才能很好地工作。

假设我们知道 x 介于 f(p) 和 f(q) 之间，这构成了搜索区间。该算法将检查 x 是大于还是小于 f((p + q) / 2)，即区间的中间点。

在搜索连续函数时，我们可能永远无法找到确切的值（例如，找到 π 的末尾？）。需要一个误差范围来检查与区间的中间点的距离。我们可以将误差范围视为当计算值接近目标值时的提前停止。例如，如果误差范围是 0.001%，那么 3.141624 足够接近 π，大约 3.1415926...

如果计算值足够接近目标值，则搜索完成；否则，如果 x 小于 f((p + q) / 2)，则在下半部分搜索该值，反之亦然。

现在让我们看以下 Python 代码片段，演示了这一点。

示例

def bisectionAlgorithm(f, p, q, y, margin = .00_001):
    ''' Bracketed approach of Root-finding with bisection method
    Arguments
    ----------
    f: callable, continuous function
    p: float, lower bound to be searched
    q: float, upper bound to be searched
    y: float, target value
    margin: float, error margin in absolute term

    Return Values
    ----------
    A float r, where f(r) is within the margin of y
    '''
    
    if (lower := f(p)) > (upper := f(q)):
        p, q = q, p
        lower, upper = upper, lower

    assert y >= lower, f"y is smaller than the lower bound. {y} < {lower}"
    assert y <= upper, f"y is larger than the upper bound. {y} > {upper}"

    while 1:
        r = (p + q) / 2
        if abs((y_r := f(r)) - y) < margin:
            # found!
            return r
        elif y < y_r:
            p, upper = r, y_r
        else:
            q, lower = r, y_r

说明

在上述代码片段中，我们定义了一个名为 bisectionAlgorithm 的函数，它接受一些参数，如 f, p, q, y 和 margin，其中 f 是一个可调用的连续函数，p 是一个浮点值，表示搜索的下限，q 也是一个浮点值，表示搜索的上限，y 再次是一个浮点值，表示目标值，而 margin 是绝对项的误差范围，也是一个浮点值。然后，我们使用 if 条件语句来检查分配给 f(p) 的下限是否大于分配给 f(q) 的上限，在这种情况下，p 和 q 的值等于 q 和 p，下限和上限等于上限和下限。然后，我们使用 assert 关键字来调试 y 的值。然后，我们使用 while 循环，在该循环中，我们将 r 的值定义为 p 和 q 的平均值。在该循环内部，我们还使用了 if-elif-else 条件语句来检查分配给 f(r) - y 的 y_r 是否小于 margin 并返回 r。

理解假位法

与二分法类似，假位法，也称为 Regula Falsi，也采用区间逼近法。但与二分法不同的是，它不采用将问题空间每次迭代减半的暴力方法。相反，该算法迭代地从 f(p) 到 f(q) 绘制一条直线，并比较截距与目标值。然而，不能保证搜索效率始终得到提高。例如，下图描述了下限如何以递减的速度增加，而上限保持不变。

Effective Root Searching Algorithms in Python

图 1：停滞边界减慢收敛速度

主要优点

该算法通常比二分法收敛更快。
Regula Falsi 的好处在于，随着区间的缩小，连续函数将收敛到一条直线。

主要缺点

当算法遇到停滞边界时，Regula Falsi 也会显示出较慢的收敛速度。
该算法需要了解根的近似区域。例如，3 ≤ π ≤ 4。

Regula Falsi 和二分法在实现上的主要区别在于 r 不再是 p 和 q 之间的中点；而是估计为

让我们看下面的代码片段来说明这一点：

示例

def regulaFalsiAlgorithm(f, p, q, y, margin = .00_001):
    ''' Bracketed approach of Root-finding with regula-falsi method
    Arguments
    ----------
    f: callable, continuous function
    p: float, lower bound to be searched
    q: float, upper bound to be searched
    y: float, target value
    margin: float, error margin in absolute term
    
    Return Values
    ----------
    A float r, where f(r) is within the margin of y
    '''

    assert y >= (lower := f(p)), f"y is smaller than the lower bound. {y} < {lower}"
    assert y <= (upper := f(q)), f"y is larger than the upper bound. {y} > {upper}"

    while 1:
        r = ((p * (upper - y)) - (q * (lower - y))) / (upper - lower)
        if abs((y_r := f(r)) - y) < margin:
            # found!
            return r
        elif y < y_r:
            q, upper = r, y_r
        else:
            p, lower = r, y_r

说明

在上述代码片段中，我们定义了一个名为 regulaFalsiAlgorithm 的函数，它接受一些参数，如 f, p, q, y 和 margin，其中 f 是一个可调用的连续函数，p 是一个浮点值，表示搜索的下限，q 也是一个浮点值，表示搜索的上限，y 再次是一个浮点值，表示目标值，而 margin 是绝对项的误差范围，也是一个浮点值。然后，我们使用 assert 关键字来调试 y 的值。然后，我们使用 while 循环，在该循环中，我们定义了 r 的值。在该循环内部，我们还使用了 if-elif-else 条件语句来检查分配给 f(r) - y 的 y_r 是否小于 margin 并返回 r。

理解伊利诺伊算法（修改后的假位法）

为了克服停滞边界，我们可以插入一个条件规则，当一个边界连续两轮保持停滞时。以前面的例子为例，由于 q 已经两轮没有移动，并且 r 尚未接近根 x，在下一轮中，直线将画到 f(q) / 2 而不是 f(q)。如果下限是停滞边界，也将对下限实施相同的操作。

图 2：伊利诺伊算法避免长期停滞边界以加快收敛。

主要优点

伊利诺伊算法比二分法和假位法收敛速度更快。
我们可以通过将停滞边界到目标值的距离减半来避免停滞边界。

主要缺点

当算法遇到停滞边界时，该算法也会显示出较慢的收敛速度。
该算法需要了解根的估计区域。例如，3 ≤ π ≤ 4。

示例

def illinoisAlgorithm(f, p, q, y, margin = .00_001):
    ''' Bracketed approach of Root-finding with illinois method
    Arguments
    ----------
    f: callable, continuous function
    p: float, lower bound to be searched
    q: float, upper bound to be searched
    y: float, target value
    margin: float, error margin in absolute term
    
    Return Values
    ----------
    A float r, where f(r) is within the margin of y
    '''

    assert y >= (lower := f(p)), f"y is smaller than the lower bound. {y} < {lower}"
    assert y <= (upper := f(q)), f"y is larger than the upper bound. {y} > {upper}"

    stagnant = 0

    while 1:
        r = ((p * (upper - y)) - (q * (lower - y))) / (upper - lower)
        if abs((y_r := f(r)) - y) < margin:
            # found!
            return r
        elif y < y_r:
            q, upper = r, y_r
            if stagnant == -1:
                # Lower bound is stagnant!
                lower += (y - lower) / 2
            stagnant = -1
        else:
            p, lower = r, y_r
            if stagnant == 1:
                # Upper bound is stagnant!
                upper -= (upper - y) / 2
            stagnant = 1

说明

在上述代码片段中，我们定义了一个名为 illinoisAlgorithm 的函数，它接受一些参数，如 f, p, q, y 和 margin，其中 f 是一个可调用的连续函数，p 是一个浮点值，表示搜索的下限，q 也是一个浮点值，表示搜索的上限，y 再次是一个浮点值，表示目标值，而 margin 是绝对项的误差范围，也是一个浮点值。然后，我们使用 assert 关键字来调试 y 的值。然后，我们定义了一个名为 stagnant 的变量，并将其赋值为零。然后，我们使用 while 循环，在该循环中，我们定义了 r 的值。在该循环内部，我们还使用了 if-elif-else 条件语句来检查分配给 f(r) - y 的 y_r 是否小于 margin 并返回 r。

理解割线法（准牛顿法）

到目前为止，我们一直在实施区间逼近法。如果我们不知道区间的确切位置怎么办？在这种情况下，割线法可能会有所帮助。割线法是一种迭代算法，从两个值开始并尝试向目标值收敛。虽然在算法收敛时我们可以获得更好的性能，并且不需要了解粗略的根位置，但如果两个初始值离真实根太远，我们可能会面临发散的风险。

主要优点

割线法不需要包含根的区间。
该方法不需要了解根的估计区域。

主要缺点

1. 与所有早期方法不同，割线法不能保证收敛。

割线法从检查两个用户定义的种子开始。假设我们要找到 x² - math.pi = 0 的根，从 x_0 = 4 和 x_1 = 5 开始；我们的种子将分别是 4 和 5。（注意：这个过程类似于搜索 x，例如 x² = math.pi）

图 3：割线法根据 x1 和 x2 定位 x3

然后，我们通过 f(x_0) 和 f(x_1) 绘制一条直线来定位与目标值 x_2 的截距，这与我们在 Regula Falsi 算法中所做的相同。如果 f(x_2) 不够接近目标值，我们必须重复该步骤并定位 x_3。通常，我们可以使用以下公式计算下一个 x：

让我们看下面的代码片段来说明这一点：

示例

def secantAlgorithm(f, x0, x1, y, iterations, margin = .00_001):
    ''' Iterative approach of Root-finding with secant method
    Arguments
    ----------
    f: callable, continuous function
    x0: float, initial seed
    x1: float, initial seed
    y: float, target value
    iterations: int, maximum number of iterations to avoid indefinite divergence
    margin: float, margin of error in absolute term
    Return Values
    ----------
    A float x2, where f(x2) is within the margin of y
    '''

    assert x0 != x1, "Two different initial seeds are required."

    if abs((y0 := f(x0) - y)) < margin:
        # found!
        return x0
    if abs((y1 := f(x1) - y)) < margin:
        # found!
        return x1

    for i in range(iterations):
        x2 = x1 - y1 * (x1 - x0) / (y1 - y0)
        if abs((y2 := f(x2) - y)) < margin:
            # found!
            return x2
        x0, x1 = x1, x2
        y0, y1 = y1, y2
    return x2

说明

在上述代码片段中，我们定义了一个名为 secantAlgorithm 的函数，它接受一些参数，如 f, x0, x1, y, iterations 和 margin，其中 f 是一个可调用的连续函数，x0 和 x1 是浮点值和初始种子，y 再次是一个浮点值和目标值，iterations 是一个整数值，存储最大迭代次数以避免无限发散，而 margin 是绝对项的误差范围，也是一个浮点值。然后，我们使用 assert 关键字来检查 x0 的值是否不等于 x1 的值。然后，我们使用 if 条件语句来检查分配给 f(x0) - y 的 y0 是否小于 margin 变量并返回 x0 变量。我们再次使用 if 条件语句来检查分配给 f(x1) - y 的 y1 是否小于 margin 变量并返回 x1 变量。最后，我们使用 for 循环来迭代存储在 iterations 变量中的值，并定义查找根的公式。在循环中，我们再次使用 if 条件语句并返回 x2。

理解 Steffensen 方法

割线法通过消除包含根的区间的需求，进一步改进了 Regula Falsi 算法。让我们回顾一下，直线只是两个 x 值（或 Regula Falsi 和 Illinois 算法中的上限和下限）的切线（即导数）的朴素值。当搜索收敛时，这个值将是完美的。在 Steffensen 算法中，我们将尝试用更好的导数值替换直线，以进一步改进割线法。

主要优点

Steffensen 方法不需要包含根的区间。
此方法也不需要了解根的估计区域。
如果可能，此方法比割线法收敛更快。

主要缺点

如果初始种子离真实根太远，Steffensen 方法不能保证收敛。
连续函数将比割线法多评估两次，以更好地计算导数。

借助 Steffensen 算法，我们可以通过根据用户定义的初始种子 x0 计算以下内容来更好地估计导数：

这等价于以下内容，其中 h = f(x)

取 h 趋于 0 的极限，我们将得到 ?(?) 的导数。

然后，我们将使用广义评估斜率函数，按照与割线法相同的程序定位下一步

让我们看下面的代码片段来说明这一点：

示例

def steffensenAlgorithm(f, x, y, iterations, margin = .00_001):
    ''' Iterative approach of Root-finding with steffensen's method
    Arguments
    ----------
    f: callable, continuous function
    x: float, initial seed
    y: float, target value
    iterations: int, maximum number of iterations to avoid indefinite divergence
    margin: float, error margin in absolute term
    Return Values
    ----------
    A float x2, where f(x2) is within the margin of y
    '''

    assert x != 0, "Initial seed can't be zero."
    
    if abs((yx := f(x) - y)) < margin:
        # found!
        return x

    for n in range(iterations):
        g = (f(x + yx) - y) / yx - 1
        if g * x == 0:
            # Division by zero, search stops
            return x
        x -= (f(x) - y) / (g * x)
        if abs((yx := f(x) - y)) < margin:
            # found!
            return x
    return x

说明

在上述代码片段中，我们定义了一个名为 secantAlgorithm 的函数，它接受一些参数，如 f, x0, x1, y, iterations, 和 margin，其中 f 是一个可调用的连续函数，x0 和 x1 是浮点值和初始种子，y 再次是一个浮点值和目标值，iterations 是一个整数值，存储最大迭代次数以避免无限发散，而 margin 是绝对项的误差范围，也是一个浮点值。然后，我们使用 assert 关键字来检查初始种子是否不等于零。然后，我们使用 if 条件语句来检查分配给 f(x) - y 的 yx 是否小于 margin 变量并返回 x 变量。最后，我们使用 for 循环来迭代存储在 iterations 变量中的值，并定义查找根的公式。在循环中，我们再次使用 if 条件语句并返回 x。

结论

在上面的教程中，我们了解了以下五种用于搜索根的算法的优点、缺点和实现。

二分法
假位法
伊利诺伊算法
割线法
Steffensen 算法

现在让我们看下表，显示了我们已实现的算法的比较。

	二分法	假位法	伊利诺伊算法	割线法	Steffensen 算法
方法	区间	区间	区间	迭代	迭代
收敛	保证	保证	保证	不保证	不保证
根近似位置的知识	必需	必需	必需	不需要	不需要
初始种子数	2	2	2	2	1
收敛缓慢的风险	不可用	停滞边界	不可用	初始种子与根不够接近	初始种子与根不够接近
减少问题空间的方法	暴力减半	有限差分近似导数	有限差分近似导数	有限差分近似导数	有限差分近似导数
收敛速度	线性	线性	超线性	超线性	二次

一旦我们熟悉了这些算法，还有许多其他本教程中未涉及的求根算法值得探索。其中一些包括牛顿-拉夫逊法、逆二次插值、Brent 法等等。继续探索，并将上述算法添加到您的工具库中。

下一个主题Python Bz2 模块

Python 中有效的根搜索算法

理解二分法

理解假位法

理解伊利诺伊算法（修改后的假位法）

理解割线法（准牛顿法）

理解 Steffensen 方法

结论

联系信息

关注我们

教程

面试题

在线编译器

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

Python 问题

Python 中有效的根搜索算法

理解二分法

理解假位法

理解伊利诺伊算法（修改后的假位法）

理解割线法（准牛顿法）

理解 Steffensen 方法

结论

相关帖子

Python PltPcolor

Python Cachetools 模块

Python 中的井字棋

Python 字典列表

Python 中打印金字塔技术的程序

Python Popen

Python 中的异常处理

Python 项目 - 使用深度学习进行乳腺癌分类

Python - 合并文件夹中的所有 CSV 文件

如何处理 Python 中的 XML

订阅 Tpoint Tech

联系信息

关注我们

教程

面试题

在线编译器