函数导数简介

2025年6月23日 | 阅读 4 分钟

在机器学习领域，“函数导数”一词指的是函数输出相对于其输入变量的变化率/敏感度。导数之所以重要，是因为它们提供了一种优化机器学习模型的方法，提供有关如何调整模型参数（在大多数情况下是权重和偏差）以最小化误差的信息。

在机器学习中，导数的概念主要用于优化算法，特别是那些依赖梯度的算法，例如梯度下降，它通过学习减少损失函数来帮助模型优化建模参数。

导数是机器学习模型中许多主要过程的基础。它们通过提供关于输入特征或模型参数的微小变化如何最终改变最终结果行为的见解，使模型能够在数据的上下文中学习。

函数

函数描述了变量对之间的关系，其中函数使用一个变量来确定另一个变量的值。我们所说的函数是所有监督学习的基础——在监督学习中，目标是找到最能解释底层数据函数的最准确函数。对该函数的估计是机器学习的一个关键方面。在数学中，函数通常表示为

y=f(x)=x^2(x square)
y=f(x)=max(x,0)

在这种情况下，y 取决于 x，这意味着 y 的值由 x 决定。第一种情况表示 x 的平方；第二种情况取 x 的正值，当 x 为负时返回 0。这种关系可以通过在 matplotlib 中生成的图表进行可视化表示。

示例 1

import matplotlib.pyplot as plt
x = range(-10,10)
y = [x*x for x in x]
plt.scatter(x, y)
plt.show()

输出

示例 2

import matplotlib.pyplot as plt
x = range(-10,10)
y = [max(x,0) for x in x]
plt.scatter(x, y)
plt.show() 

输出

导数

单个函数在指定点的导数表示该位置的函数斜率或变化率。它显示了函数输入的微小变化如何影响函数的输出。因此，导数是函数值相对于函数输入的微小变化的变化。对于某些函数来说，这个过程非常简单。具体来说，对于代数函数，导数通常通过将变量的幂次减一并乘以原始幂次来找到。

然而，三角函数的导数通常是不同的。周期曲线的导数通常是同一族中的另一条周期曲线。例如，sin(x) 的导数是 cos(x)，因为 sin(x) 函数的斜率将与 cos(x) 函数有 90 度的相位差。指数函数是独一无二的，因为它们的导数等于函数本身。

这是因为指数函数随着变量幂次的增加而无限扩展。无论我们对指数函数求导多少次，我们总是会回到相同的形式。这种独特的特性是指数函数在科学和工程中如此受欢迎的原因。

示例 1

import numpy as np
import matplotlib.pyplot as plt

# Let's define a simple function f(x) = x^2 - 4x + 5
# We'll do a manual gradient descent to find the minimum.

def f(x):
    return x2 - 4x + 5

def df(x):
    """Derivative of f(x) = 2x - 4"""
    return 2x - 4

# Hyperparameters for gradient descent
learning_rate = 0.1
num_iterations = 15

# Start from an initial guess
current_X = 5.0
history = []

for i in range(num_iterations):
    grad = df(current_X)
    current_X = current_X - learning_rate  grad
    history.append((current_X, f(current_X)))

# Plotting the function and the descent steps
vals_x = np.linspace(-1, 6, 100)
vals_y = [f(x) for x in vals_x]

plt.figure(figsize=(7, 5))
plt.plot(vals_x, vals_y, label="f(x) = x^2 - 4x + 5")
plt.scatter([p[0] for p in history], [p[1] for p in history],
            color='red', marker='x', label="Gradient Steps")

plt.title("Gradient Descent on a Simple Function")
plt.xlabel("x")
plt.ylabel("f(x)")
plt.legend()
plt.show()

print(f"Optimal x found: {current_X:.2f}")
print(f"Minimum value of f(x): {f(current_X):.2f}")

输出

找到最优 x：2.11

f(x) 的最小值：1.01

TensorFlow 提供了一个方便的函数 `tf.GradientTape` 来计算梯度。在像 Keras 这样的更高级别库中，此函数在神经网络的训练过程中会自动调用。

示例 2

import tensorflow as tf
import numpy
x = tf.Variable([10.0])

with tf.GradientTape() as tape:
  y = x**2
fdash=tape.gradient(y, x)
fdash.numpy()

输出

 
array([20.], dtype=float32)

如果一个 x 的函数嵌套在另一个 x 的函数中，则应用微分的链式法则。

代码

from sympy import * 
f = symbols('f', cls=Function)
t= symbols('t')
x =  t**2
y = sin(t)
g = f(x,y)
Derivative(g,t).doit()

输出

下一个主题K-Medoids 聚类 - 理论解释

← 上一个下一个 →

函数导数简介

函数

导数

联系信息

关注我们

教程

面试题

在线编译器

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

机器学习

监督式学习

分类

杂项

相关教程

面试题

函数导数简介

函数

导数

相关帖子

Ada Boost 算法在机器学习中的应用

微分和积分微积分

数据科学 vs. 机器学习 vs. 大数据

最大似然估计简介

MLOps 简介

自动编码器

机器学习中的正则化

Extra Trees 分类器

机器学习中的统计功效

使用 ColumnTransformer 和 OneHotEncoder 进行预测

订阅 Tpoint Tech

联系信息

关注我们

教程

面试题

在线编译器