第 k 大的连续子数组和

2025年3月17日 | 阅读 8 分钟

引言

在更广泛的子数组求和问题中，K-th Largest Sum Contiguous Subarray（K-th Largest Sum Contiguous Subarray）问题是一个具有挑战性的算法任务。其目标是找出数组中所有可能的连续子数组的和中的第 K 大的那个。这个问题在需要识别数据集中重要模式或趋势的领域有着广泛的应用，例如金融、数据分析和图像处理。通过理解数据变化并找出具有最大累积和的特定片段，可以获得现实世界情况下的洞察。例如，在金融数据分析中，找出 K-th Largest Sum Contiguous Subarray 可以用来识别显著的金融增长或下降的时期。同样，这个问题也可以用于图像处理，以找到像素值最高的区域，这可能表示重要的特征或异常。

为了解决 K-th Largest Sum Contiguous Subarray 问题，需要能够最小化时间和空间复杂度的有效算法来处理大型数据集。从蛮力方法到动态规划和利用堆等数据结构的先进方法，各种方法都提供了对有效识别 K-th Largest Sum Contiguous Subarray 的独特见解。

暴力破解法

使用蛮力方法是解决 K-th Largest Sum Contiguous Subarray 问题的最直接方法。这涉及到生成所有可能的子数组并计算每个子数组的值。然后，通过将这些和按降序排序来返回第 K 大的那个和。

代码

#include <stdio.h>
#include <stdlib.h>
int compare(const void *a, const void *b);
int kthLargestSumSubarray(int arr[], int n, int k) {
    int *allSums = (int *)malloc(sizeof(int) * n * (n + 1) / 2);
    int index = 0;
    for (int i = 0; i < n; i++) {
        int currentSum = 0;
        for (int j = i; j < n; j++) {
            currentSum += arr[j];
            allSums[index++] = currentSum;
        }
    }
    qsort(allSums, index, sizeof(int), compare);
    return allSums[k - 1];
}
int compare(const void *a, const void *b) {
    return (*(int *)b - *(int *)a);
}
int main() {
    int arr[] = {4, -8, 9, -4, 1, -8, -1, 6};
    int n = sizeof(arr) / sizeof(arr[0]);
    int k = 3;
    int result = kthLargestSumSubarray(arr, n, k);
    printf("The %d-th largest sum contiguous subarray is: %d\n", k, result);
    return 0;
}

输出

代码解释

动态内存分配

一个名为 allSums 的数组是用于存储所有可能的子数组和的动态分配内存。

嵌套循环计算子数组和

使用两个嵌套循环遍历数组来获取所有可能的子数组和。
外层循环 (i) 表示子数组的起始索引。
内层循环 (j) 表示子数组的终止索引。

计算子数组和的方法

使用一个名为 currentSum 的变量来计算当前子数组的和。

对子数组和进行排序

使用 qsort 函数将子数组和的数组按降序排序。
排序过程使用 compare 函数作为比较器。

返回第 K 大的和

从排序后的子数组和数组中提取第 K 大的和并返回。

比较器函数 (compare) 的功能

qsort 函数声明它将使用一个比较器函数。
以降序比较两个整数。

主函数

main 函数调用 kthLargestSumSubarray 函数，初始化一个数组，并设置 K 的值。
控制台显示结果。

时间和空间复杂度分析

用于查找第 K 大的连续子数组和的代码的时间复杂度主要由 qsort 函数的排序操作决定。嵌套循环生成所有可能的子数组和，时间复杂度为 O(n^2)，其中 'n' 是输入数组的长度。然而，排序操作的时间复杂度为 O(n*log(n))（平均情况）。因此，最终的时间复杂度为 O(n^2 + n*log(n))，但在实际应用中，排序过程很可能是主要影响因素。

空间复杂度为 O(n^2)，因为需要存储所有可能的子数组和。这取决于为 allSums 数组（一个长度为 'n' 的数组，其大小与子数组的数量成正比，即 n*(n+1)/2）进行动态内存分配。变量和比较器函数也占用常数空间，这不会显著影响整体空间复杂度。

动态规划方法

Kadane 算法是用于查找最大和连续子数组的著名动态规划方法。可以通过修改此算法，使其在遍历数组时能够跟踪第 K 大的和。

代码

int max(int a, int b) {
    return (a > b) ? a : b;
}
int kthLargestSumSubarray(int arr[], int n, int k) {
    int *currentSum = (int *)malloc(sizeof(int) * n);
    currentSum[0] = arr[0];
    int *kthSums = (int *)malloc(sizeof(int) * k);
    for (int i = 0; i < k; i++) {
        kthSums[i] = 0;
    }
    for (int i = 1; i < n; i++) {
        currentSum[i] = max(arr[i], currentSum[i - 1] + arr[i]);
        for (int j = k - 1; j > 0; j--) {
            kthSums[j] = max(kthSums[j], kthSums[j - 1] + currentSum[i]);
        }
        kthSums[0] = max(kthSums[0], currentSum[i]);
    }
    int result = kthSums[k - 1];
    free(currentSum);
    free(kthSums);
    return result;
}
int main() {
    int arr[] = {4, -8, 9, -4, 1, -8, -1, 6};
    int n = sizeof(arr) / sizeof(arr[0]);
    int k = 3;
    int result = kthLargestSumSubarray(arr, n, k);
    printf("The %d-th largest sum contiguous subarray is: %d\n", k, result);
    return 0;
}

输出

代码解释

最大值函数

使用三元运算符定义了一个简单的函数来确定两个整数的最大值。

K-th 阶连续子数组函数

currentSum 和 kthSums 是为其分配了动态内存的两个数组。
currentSum 存储结束于每个索引的子数组的当前和。
kthSums 最初存储第 K 大的和。
在遍历数组时，currentSum 和 kthSums 会被更新。
result 变量包含第 K 大的和。
为了防止内存泄漏，会释放动态内存。

主函数

设置数组的长度、初始值和 K。
利用数组、长度和 K 参数调用 kthLargestSumSubarray 函数。
将结果打印到控制台。

时间和空间复杂度分析

代码的时间复杂度主要由遍历输入数组的嵌套循环决定。外层循环的时间复杂度为 O(n)，而内层循环及其最大值操作的复杂度为 O(k)。因此，总时间复杂度为 O(n * k)。

空间复杂度主要由 currentSum 和 kthSums 数组的动态内存分配决定。currentSum 的大小为 O(n)，而 kthSums 的大小为 O(k)。因此，总空间复杂度为 O(n + k)。函数和主程序中使用的常数空间也对空间复杂度有影响。

优先队列方法

使用优先队列（堆）来跟踪 K 个最大的和是另一种有效的方法。在遍历数组时，我们会用当前和来更新堆。堆的顶端元素始终是第 K 大的和。

代码

#include <stdio.h>
#include <stdlib.h>
struct HeapNode {
    int sum;
    int i;
    int j;
};
void swap(struct HeapNode *x, struct HeapNode *y) {
    struct HeapNode temp = *x;
    *x = *y;
    *y = temp;
}
void minHeapify(struct HeapNode *minHeap, int i, int heapSize) {
    int smallest = i;
    int leftChild = 2 * i + 1;
    int rightChild = 2 * i + 2;

    if (leftChild < heapSize && minHeap[leftChild].sum < minHeap[smallest].sum) {
        smallest = leftChild;
    }
    if (rightChild < heapSize && minHeap[rightChild].sum < minHeap[smallest].sum) {
        smallest = rightChild;
    }
    if (smallest != i) {
        swap(&minHeap[i], &minHeap[smallest]);
        minHeapify(minHeap, smallest, heapSize);
    }
}
void buildMinHeap(struct HeapNode *minHeap, int heapSize) {
    int i = (heapSize - 1) / 2;
    while (i >= 0) {
        minHeapify(minHeap, i, heapSize);
        i--;
    }
}
int kthLargestSumSubarray(int arr[], int n, int k) {
    struct HeapNode *minHeap = (struct HeapNode *)malloc(sizeof(struct HeapNode) * k);
    int *currentSum = (int *)malloc(sizeof(int) * n);
    currentSum[0] = arr[0];
    int heapSize = 0;
    for (int i = 1; i < n && i <= k; i++) {
        minHeap[heapSize].sum = currentSum[i - 1] + arr[i];
        minHeap[heapSize].i = i - 1;
        minHeap[heapSize].j = i;
        heapSize++;
        currentSum[i] = currentSum[i - 1] + arr[i];
    }
    buildMinHeap(minHeap, heapSize);
    for (int i = k; i < n; i++) {
        if (arr[i] > minHeap[0].sum) {
            currentSum[i] = arr[i];
        } else {
            currentSum[i] = minHeap[0].sum;
            minHeap[0].sum = currentSum[i];
            minHeap[0].i = i;
            minHeap[0].j = i;
            minHeapify(minHeap, 0, heapSize);
        }
        for (int j = heapSize - 1; j > 0; j--) {
            int parent = (j - 1) / 2;
            if (minHeap[j].sum + currentSum[i] < minHeap[parent].sum) {
                swap(&minHeap[j], &minHeap[parent]);
            }
        }
    }
    int result = minHeap[0].sum;
    free(minHeap);
    free(currentSum);
    return result;
}
int main() {
    int arr[] = {4, -8, 9, -4, 1, -8, -1, 6};
    int n = sizeof(arr) / sizeof(arr[0]);
    int k = 3;
    int result = kthLargestSumSubarray(arr, n, k);
    printf("The %d-th largest sum contiguous subarray is: %d\n", k, result);
    return 0;
}

输出

代码解释

最小堆结构

代码定义了一个 HeapNode 结构来表示最小堆中的一个节点。它包含子数组的索引 i 和 j 以及和。

交换函数

定义了一个 swap 函数来交换两个 HeapNode 结构。

最小堆化函数

minHeapify 函数维护最小堆属性。它递归地将一个节点与其子节点进行比较，并在必要时进行交换。

构建最小堆函数

buildMinHeap 函数反复使用 minHeapify 从一个数组构建一个最小堆。

K-th Largest Subarray Sum 函数

主函数 kthLargestSumSubarray 通过使用最小堆有效地跟踪第 K 大的和。
为 currentSum 和 minHeap 分配动态内存。
将前 K 个元素添加到最小堆中。
在迭代处理剩余元素时更新堆和 currentSum。
最小堆的顶部是第 K 大的和。

主函数

主函数初始化一个数组、其长度和 K 的值。
利用数组、长度和 K 参数调用 kthLargestSumSubarray 函数。

时间和空间复杂度分析

代码（用于查找 K-th Largest Sum Contiguous Subarray）的时间复杂度和空间复杂度分别为 O(n * log(k)) 和 O(k)，其中 'n' 是输入数组的长度。遍历数组和最小堆操作会影响时间复杂度。相比之下，最小堆的动态内存分配是空间复杂度的主要原因。通过使用最小堆，代码有效地维护了第 K 大的和，与蛮力方法相比，用更少的时间和空间开销处理大型数据集。

下一个主题小于或等于给定数的子数组个数

第 k 大的连续子数组和

引言

暴力破解法

动态规划方法

优先队列方法

联系信息

关注我们

教程

面试题

在线编译器

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

数据结构教程

DS 数组

DS 链表

DS 栈

DS 队列

DS 树

DS 图

DS 搜索

DS 排序

哈希与堆

差异

二叉树

二叉搜索树

AVL 树

单向链表

双向链表

循环链表

循环双向链表

DS 选择题

其他

第 k 大的连续子数组和

引言

暴力破解法

动态规划方法

优先队列方法

相关帖子

查找二叉树中的重复子树

在数组中查找和为给定值的三个数

使用栈反转数字

数组对和可整除性问题

哈希表 vs STL Map

后缀数组 nLogN 算法

使用临时栈对栈进行排序

计算二叉树中的非叶子节点数量

数据结构中栈的表示

K 中心问题 (贪心近似算法)

订阅 Tpoint Tech

联系信息

关注我们

教程

面试题

在线编译器