跳转至

Chap 7 Sorting

约 3325 个字 260 行代码 预计阅读时间 20 分钟

核心知识

本来这里应该整理一张表格,表示每种排序的时间复杂度和适用情况等等,但因时间问题来不及整理,之后会补上

核心知识就看目录的二级标题吧,实在没时间了(悲)

Preliminaries

void X_sort(ElementType A[], int N)

  • N 必须是合法的整数
  • 方便起见,假设数组元素都是整数
  • 基于比较的排序(comparison-based sorting):假定存在 <, > 运算符,且它们是唯一能够用于输入数据的运算符
  • 仅考虑内部排序(internal sorting)(即整个排序能在主内存中完成)

注:教材中未提到选择排序冒泡排序,但考试会考。若忘记了它们的原理,自己上网搜。

Insertion Sort

插入排序(insertion sort)的大致原理

重复 N - 1 趟排序,从 P = 1 到 P = N - 1 。排序前已知0~P-1位置上的元素是有序的。对于第 P 趟排序,我们将位置 P 上的元素向前 P 个元素移动,直到发现正确的位置。这样保证每趟排序结束后位置在 0 ~ P 上的元素是有序的。

代码实现
void InsertionSort(ElementType A[], int N)
{
    int j, P;
    ElementType Tmp;

    for (P = 1; P < N; P++)
    {
        Tmp = A[P] // the next coming card
        for (j = P; j > 0 && A[j - 1] > Tmp; j--)
            A[j] = A[j - 1];
        // shift sorted cards to provide a position for the new coming card
        A[j] = Tmp; // place the new card at the proper position
    } // end for-P-loop
}
  • 最坏情况:输入的 A[]逆序的,\(T(N) = O(N^2)\)
  • 最好情况:输入的 A[] 是顺序的,\(T(N) = O(N)\)
  • 平均情况:\(\Theta(N^2) = \sum\limits_{i = 2}^Ni = 2 + 3 + 4 + \dots + N\)

A Lower Bound for Simple Sorting Algorithms

定义:一个数组中数字的逆序对(inversion)是一个有序对 \((i, j)\),满足 \(i < j\)\(A[i] > A[j]\)

观察发现:数组中逆序对的个数 = 其插入排序过程中的交换次数

证明:交换两个相邻的元素,就可以消去数组中的一个逆序对

所以,插入排序的时间复杂度还可以表示为 \(T(N, I) = O(I + N)\),其中\(I\)是原始数组中逆序对的个数。观察发现,当列表已经排过序了,那么这次排序的速度就会很快。

定理1:对于包含 N 个不同数字的数组,它的平均逆序对个数\(\dfrac{N(N-1)}{4}\)

定理2:任何通过交换相邻元素实现的排序算法,平均时间复杂度为 \(\Omega(N^2)\)

由这些定理,我们知道:可以通过在每次交换中消除多个逆序对的方式来提升排序效率

Shellsort

希尔排序(shellsort)的大致原理

  • 这种算法比较相隔一定距离的元素
  • 比较的间隔在算法运行时将不断减小,直到最后比较的是相邻元素

因此这种排序也被称为缩小增量排序(diminishing increment sort),它是不稳定的排序

动画演示

关键概念

  • 增量序列(increment sequence)\(h_1 < h_2 < \dots < h_t(h_1 = 1)\),它决定了希尔排序的运行时间

  • \(h_k\)-sort:阶段 \(k = t, t - 1, \dots, 1\) 的排序。\(h_k\)-sort 后,可以确保序列 A 中 \(\forall i,\ A[i] \le A[i + h_k]\)

    • \(h_k\)-sorted 的序列,经历了 \(h_{k-1}\)-sort 后,保持 \(h_k\)-sorted
    • 具体做法:对某个位置为 i 的元素,在位置为 \(i, i - h_k, i - 2h_k, \dots\) 的元素中进行插入排序,因此1个 \(h_k\)-sort 包含 \(h_k\) 次独立的插入排序

希尔增量序列(Shell's increment sequence)

\[ h_t = \lfloor \dfrac{N}{2} \rfloor,\ h_k = \lfloor \dfrac{h_{k+1}}{2} \rfloor \]
代码实现
void Shellsort(ElementType A[], int N)
{
    int i, j, increment;
    ElementType Tmp;
    for (increment = N / 2; increment > 0; increment /= 2)
        // h sequence
        for (i = increment; i < N; i++)
        { // insertion sort
            Tmp = A[i];
            for (j = i; j >= increment; j -= increment)
                if (Tmp < A[j - increment])
                    A[j] = A[j - increment];
                else
                    break;
                A[j] = Tmp;
        } // end for-l and for-increment loop
}

定理:使用希尔增量的希尔排序的最坏运行时间为 \(\Theta(N^2)\)

注:证明部分见书本 \(P_{224}\)

糟糕的情况

因为这些增量不是两两互质的,因此更小的增量起到的作用不大


改进版:希巴德增量序列(Hibbard's increment sequence)

\[ h_k = 2^k - 1 \]

此时可以保证增量的两两互质

定理:使用希巴德增量的希尔排序的最坏运行时间为 \(\Theta(N^{\frac{3}{2}})\)

注:证明部分见书本\(P_{225}\)

补充
  • \(T_{\text{avg-Hibbard}}(N) = O(N^{\frac{5}{4}})\)
  • 塞奇威克(Sedgewick)的最佳序列是{1, 5, 19, 41, 109, …},这些项要么来自 \(9 \times 4^i - 9 \times 2^i + 1\),要么来自 \(4^i - 3 \times 2^i + 1\)
    • \(T_{avg}(N) = O(N^{\frac{7}{6}})\)
    • \(T_{worst}(N) = O(N^{\frac{4}{3}})\)

虽然希尔排序非常简单,但是它的分析相当复杂。它适用于排序中等大的输入序列(成千上万的规模)

Heapsort

算法1:

Algorithm 1:
{
    BuildHeap(H);  // O(N)
    for (i = 0; i < N; i++)
        TmpH[i] = DeleteMin(H);  // O(log N)
    for (i = 0; i < N; i++)
        H[i] = TmpH[i];  // O(1)
}

缺陷:使用了额外的数组,占用了更多的空间(拷贝不影响时间复杂度)

如何改进

观察发现,每使用1次 DeleteMin 函数,堆的规模缩小 1,而我们可以利用这个本该废弃的空间,来存放 DeleteMin 得到的最小的数。但按照这个方法,我们得到的是一个递减序列;如果要得到递增序列,需要构建最大堆并使用 DeleteMax 函数。由此,我们得到了算法 2。

算法2:

动画演示

代码实现
// 这里的 PercDown 函数与 Chap 6 给出的稍有不同(索引的标注发生变化)
#define LeftChild(i) (2 * (i) + 1)

void PercDown(ElementType A[], int i, int N)
{
    int Child;
    ElementType Tmp;

    for (Tmp = A[i]; LeftChild(i) < N; i = Child)
    {
        Child = LeftChild(i);
        if (Child != N - 1 && A[Child + 1] > A[Child])
            Child++;
        if (Tmp < A[Child])
            A[i] = A[Child];
        else
            break;
    }
    A[i] = Tmp;
}

void Heapsort(ElementType A[], int N)
{
    int i;
    for (i = N / 2; i >= 0; i--)  // BuildHeap
        PercDown(A, i, N);
    for (i = N - 1; i > 0; i--)   // DeleteMax
    {
        Swap(&A[0], &A[i]);
        PercDown(A, 0, i);
    }
}
  • 索引的标注从 0 开始(不同于 Chap 6)
  • 堆排序是一种稳定的算法

定理:对 N 个不同项的随机排列进行堆排序,平局比较时间为 \(2N \log N - O(N \log \log N)\)

注:证明见书本 \(P_{229-230}\)

尽管堆排序给出了最佳平均时间 \(O(N \log N)\),实际上它比使用 Sedgewick 增量序列的希尔排序更慢

Mergesort

归并排序(merge sort):时间复杂度 \(O(N \log N)\),它采用递归算法,是一种稳定的算法

🌰:合并 2 个已经排好序的列表

时间复杂度:\(T(N) = O(N)\)\(N\)为 2 个列表的元素个数总和

代码实现
void MergeSort(ElementType A[], int N)
{
    ElementType *TmpArray;
    TmpArray = (ElementType *)malloc(N * sizeof(ElementType));
    if (TmpArray != NULL)
    {
        MSort(A, TmpArray, 0, N - 1);
        free(TmpArray);
    }
    else FatalError("No space for tmp array!!!");
}

void MSort(ElementType A[], ElementType TmpArray[], int Left, int Right)
{
    int Center;
    if (Left < Right)
    {
        Center = (Left + Right) / 2;
        MSort(A, TmpArray, Left, Center);
        MSort(A, TmpArray, Center + 1, Right);
        Merge(A, TmpArray, Left, Center + 1, Right);
    }
}

// Lpos = start of left half, Rpos = start of right half
void Merge(ElementType A[], ElementType TmpArray[], int Lpos, int Rpos, int RightEnd)
{
    int i, LeftEnd, NumElements, TmpPos;
    LeftEnd = Rpos - 1;
    TmpPos = Lpos;
    NumElements = RightEnd - Lpos + 1;
    while (Lpos <= LeftEnd && Rpos <= RightEnd) // main loop
        if (A[Lpos] <= A[Rpos])
            TmpArray[TmpPos++] = A[Lpos++];
        else
            TmpArray[TmpPos++] = A[Rpos++];
    while (Lpos <= LeftEnd) // Copy rest of first half
        TmpArray[TmpPos++] = A[Lpos++];
    while (Rpos <= RightEnd) // Copy rest of second half
        TmpArray[TmpPos++] = A[Rpos++];
    for (i = 0; i < NumElements; i++, RightEnd--)
        // Copy TmpArray back
        A[RightEnd] = TmpArray[RightEnd];
}

  • 归并排序体现了分治(divide-and-conquer)思想:MSort 为“分”,Merge 为“治”
  • 如果每次调用 MergeTmpArray 会被局部声明,那么空间复杂度 \(S(N) = O(N \log N)\)
  • 事实上,大量的时间被用于使用 malloc 函数建立 TmpArray

Analysis

时间复杂度分析(利用递推关系):

\[ \begin{align} T(1) &= 1 \notag \\ T(N) &= 2T(\dfrac{N}{2}) + O(N) \notag \\ & = 2^kT(\dfrac{N}{2^k}) + k \cdot O(N) \notag \\ & = N \cdot T(1) + \log N \cdot O(N) \notag \\ & =O(N + N\log N) \notag \end{align} \]

注:另一种证明法见书本\(P_{233-234}\)

归并排序需要线性大小的额外内存,且拷贝数组会降低速度,因此在内部排序中这种方法不太好用,但是在外部排序(external sort)(ads 会讲)中很合适

补充:迭代版本

代码实现

可以用来打印每一趟归并排序后的结果

void merge_sort( ElementType list[],  int N )
{
    ElementType extra[MAXN];  /* the extra space required */
    int length = 1;  /* current length of sublist being merged */
    while( length < N ) {
        merge_pass( list, extra, N, length ); /* merge list into extra */
        output( extra, N );
        length *= 2;
        merge_pass( extra, list, N, length ); /* merge extra back to list */
        output( list, N );
        length *= 2;
    }
}

void merge_pass( ElementType list[], ElementType sorted[], int N, int length );
{
    int i, j;
    int ptr_l, ptr_r, ptr;

    ptr = 0;
    for (i = 0; i < N; i += 2 * length)
    {
        ptr_l = i;
        ptr_r = i + length;
        while (ptr_l < i + length && ptr_r < i + 2 * length && ptr_r < N)
        {
            if (list[ptr_l] <= list[ptr_r])
                sorted[ptr++] = list[ptr_l++];
            else
                sorted[ptr++] = list[ptr_r++];
        }
        while (ptr_l < i + length)
            sorted[ptr++] = list[ptr_l++];
        while (ptr_r < i + 2 * length && ptr_r < N)
            sorted[ptr++] = list[ptr_r++];
    }
}

void output( ElementType list[], int N )
{
    int i;
    for (i=0; i<N; i++) printf("%d ", list[i]);
    printf("\n");
}

个人感觉迭代版归并排序就像增量不断增大的希尔排序

Quicksort

The Algorithm

快速排序(quicksort)(以下简称快排)是目前已知实际上最快的排序算法,它也是一种分治递归算法,时间复杂度为 \(O(N\log N)\)

伪代码模版:

void Quicksort(ElementType A[], int N)
{
    if (N < 2) return;
    pivot = pick any element in A[]    // ?
    Partition S = A[] - {pivot} into two dijoint sets:    // ?
        A1 = {a in S | a <= pivot} and A2 = {a in S | a >= pivot}
    A = Quicksort(A1, N1) + {pivot} + Quicksort(A2, N2);
}

图示:

思考

  • 我们如何选取 pivot(支点),真的可以“随机”挑选吗?
  • 如何将数组(可以看作集合)“划分(partition)”为 2 个子数组(子集)?

Picking the Pivot

Pivot = A[0]

最坏情况:

  • 数组 A[] 已提前排好序
  • A[] 是逆序的

则所有的元素要么全部放入 A1,要么全部放入 A2,因此浪费了 \(O(N^2)\) 的时间做无意义的事

Pivot = random select from A[]

然而随机数生成的“成本”较高

Pivot = median(left, center, right)

挑选数组中最左边、中间、最右边三个元素的中数,这不仅消除了最坏情况(输入前已排好序),还节省了 5% 的运行时间

Partitioning Strategy

  • 初始状态:我们将 Pivot 与最后一个元素交换,即把 Pivot 放入最后;i 从第一个元素开始,j 从倒数第二个元素开始
  • i < j 时,

    • i 所指元素比 Pivot 小,i++,否则停止,等待交换
    • j 所指元素比Pivot大,j--,否则停止,等待交换
    • ij 都停下来了,交换 i, j 所指元素

    这样,数组中比 Pivot 小的元素在左边,比 Pivot 大的元素在右边

动画演示

Pivot = 6为例

最后当 i >= j 时,i位置上的元素(这里是 9)和 pivot(这里是 6)互换,让 pivot 重新回到中间,再对左右两边进行快排,这样顺序就对了

key == Pivot 时(key 为数组中的某个值,也就是说数组中有不止一个与 Pivot 相等的元素)

  • ⭐同时停止 ij
    • 较坏的情况:1, 1, 1, ……, 这时快排就会进行许多无意义的交换
    • 然而,这确保整个序列能够被划分均匀
    • 时间复杂度:\(T(N) = O(N \log N)\)
  • ij 均不停止:
    • 出现子序列划分不均的问题
    • 如果所有元素都相等,时间复杂度 \(T(N) = O(N^2)\)

所以,我们选择前一种方案

Small Arrays

  • 问题:当数组规模较小(\(N \le 20\))时,快排比插排慢
  • 解决方案:当N较小时,采用另一种更有效的算法(比如插排)

Implementation

代码实现
void Quicksort(ElementType A[], int N)
{
    Qsort(A, 0, N - 1);
    // A: the array
    // 0: Left index
    // N - 1: Right index
    // Return median of Left, Center, and Right
    // Order these and hide the pivot
}

void Qsort(ElementType A[], int Left, int Right)
{
    int i, j;
    ElementType Pivot;

    if (Left + Cutoff <= Right) // if the sequence is not too short
    {
        Pivot = Median3(A, Left, Right);  // select pivot
        i = Left;                         // (1)
        j = Right - 1;                    // (2)
        for (;;)
        {
            while (A[++i] < Pivot) {}     // scan from left
            while (A[--j] > Pivot) {}     // scan from right
            if (i < j)
                Swap(&A[i], &A[j]);       // adjust partition
            else break;                   // partition done
        }
        Swap(&A[i], &A[Right - 1]);       // restore pivot
        Qsort(A, Left, i - 1);            // recursively sort left part
        Qsort(A, i + 1, Right);           // recursively sort right part
    }  // end if - the sequence subarray
    else
        InsertionSort(A + Left, Right - Left + 1);
}

ElementType Median3(ElementType A[], int Left, int Right)
{
    int Center = (Left + Right) / 2;
    if (A[Left] > A[Center])
        Swap(&A[Left], &A[Center]);
    if (A[Left] > A[Right])
        Swap(&A[Left], &A[Right]);
    if (A[Center] > A[Right])
        Swap(&A[Center], &A[Right]);
    // Invariant: A[Left] <= A[Center] <= A[Right]
    Swap(&A[Center], &A[Right - 1]);
    // only need to sort A[Left + 1] .. A[Right - 2]
    // 因为我们已经知道 A[Left] 比 pivot 小,A[Right] 比 pivot 大
    // 所以回到 Qsort 函数后,我们无需改变 A[Left] 和 A[Right] 的顺序
    return A[Right - 1]; // Return pivot
}

问题

为什么 (1) 和 (2) 不能分别替换为:i = Left + 1; j = Right - 2; 呢?

这样会漏掉 A[Left + 1] 和 A[Right - 2] 两个元素的判断,这显然是错误的

Analysis

快排时间复杂度的递推关系式:

\[ T(N) = T(i) + T(N - i - 1) + cN \]
  • 最坏情况:每次快排挑选的支点都是最小的元素
\[T(N) = T(N - 1) + cN \quad \Rightarrow \quad T(N) = O(N^2)\]
  • 最好情况:支点为中间元素
\[T(N) = 2T(\dfrac{N}{2}) + cN \quad \Rightarrow \quad T(N) = O(N \log N)\]
  • 平均情况:假设\(\forall i,\ T(i)\)的平均时间为\(\dfrac{1}{N}[\sum\limits_{j = 0}^{N - 1}T(j)]\)
\[T(N) = \dfrac{2}{N}[\sum\limits_{j = 0}^{N - 1}T(j)] + cN \quad \Rightarrow \quad T(N) = O(N \log N)\]

An Example

问题

找N个元素的序列中第 k 大的元素

前景回顾

代码实现
// Places the kth smallest element in the kth position
// Because arrays start at 0. this will be index k-1
void Qselect(ElementType A[], int k, int Left, int Right)
{
    int i, j;
    ElementType Pivot;

    if (Left + Cutoff <= Right)
    {
        Pivot = Median3(A, Left, Right);
        i = Left; j = Right - 1;
        for (;;)
        {
            while (A[++i] < Pivot) {}
            while (A[--j] > Pivot) {}
            if (i < j)
                Swap(&A[i],  &A[j]);
            else
                break;
        }
        Swap(&A[i], &A[Right - 1]);

        if (k <= i)
            Qselect(A, k, Left, i - 1);
        else if (k > i + 1)
            Qselect(A, k, i + 1, Right);
    }
    else
        InsertionSort(A + Left, Right - Left + 1);
}

时间复杂度:

  • 最坏情况:\(O(N^2)\)
  • 平均情况:\(O(N)\)

总结:各种排序中的 "run" 到底是什么

历年卷中出现过很多关于排序的 "run" 问题:问第 k 次 run 后列表里的元素排序是什么?题目中的 run 可能和我们的直觉认识相冲突,为此我整理了一下常见排序的一次 run(表述不太清楚,欢迎大家的提议和改进!):

  • 选择、冒泡、插入:一遍外层循环
  • 希尔排序:一次 \(h_k\)-sort
  • 归并排序(以迭代版为例):对于整张列表,每 \(2^k\) 个元素进行归并排序,直到排完所有元素后的结果
  • 快排:对于整张列表,找到当前能找的所有支点(pivot)后的结果(如果不理解,可以回顾一下前面介绍的原理,以及对应的题目)

Sorting Large Structures

  • 问题:交换大型结构的成本较高
  • 解决方案:添加指向结构的指针,然后交换指针,这种方法被称为间接排序(indirect sorting)。之后若有需要,也可以利用指针进行直接的交换。

表排序(table sort)

要点

  • 我们用 table[] 数组存储指针。注意这里的指针不是 C 语言的指针类型,而是数组 list[] 的索引。初始化为 table[i] = i
  • list[] 的内容进行间接排序:我们只需移动指针即可(自己选择一种排序方法排序)
  • 如何输出排好序的列表:list[table[0]], list[table[1]], ..., list[table[n-1]]

上图为初始状态,下图为间接排序后的列表

物理排序

观察 Table 的值,发现这n个值的排列是由一些不相交的“环”构成(类似并查集),我们可以利用这一性质对 list 进行物理排序(真正地交换元素)

下图打阴影的部分表示 2 个环的“根节点”

动画演示

最坏情况:有 \(\lfloor \dfrac{N}{2} \rfloor\) 个环,需要 \(\lfloor \dfrac{3N}{2} \rfloor\) 次移动

时间复杂度:\(T = O(mN)\),其中 m 为结构体的大小

General Lower Bound for Sorting

定理:任何基于比较进行排序的算法,其最坏情况的计算时间为\(\Omega(N \log N)\)

证明

利用决策树(decision tree)

排序 N 个元素会产生 N! 中不同的可能情况,因此决策树至少有 N! 个叶子节点。若树的高为 k,那么 \(N! \le 2^{k-1}\),所以\(k \ge \log(N!) + 1\)

\(\because N! \ge (\dfrac{N}{2})^{\frac{N}{2}}\),即 \(\log_2 N! \ge \dfrac{N}{2}\log_2(\dfrac{N}{2}) = \Theta(N \log_2 N)\)

\(\therefore T(N) = k \ge c \cdot N \log_2 N\)


下面我们介绍的排序算法并不是基于比较的

Bucket Sort

问题

假设有 N 个学生,每个学生有一个在 0-100(因此有 M = 101 可能的不同分数)之间的成绩,那么如何在线性时间内根据他们的乘积进行排序?

图示:

伪代码:

Algorithm
{
    initialize count[];
    while (read in a student's record)
        insert to list count[stdnt.grade];
    for (i = 0; i < M; i++)
    {
        if (count[i])
            output list count[i];
    }
}

时间复杂度:\(T(N, M) = O(M + N)\)

\(M \gg N\) 时,比如 N = 10, M = 1000,如果还想在线性时间内完成排序,桶排序就不太靠谱了——而下面介绍的基数排序将胜任这一问题

Radix Sort

例子

对完全立方数进行排序,采用最低位优先(least significant digit first)的策略

每一趟后的顺序按从左往右、从上往下的方向读取,比如Pass 2后的顺序为:0, 1, 8, 512, 216, 125, 27, 729, 343, 64

时间复杂度:\(T = O(P(N + B))\),其中 \(P\) 为排序的趟数(pass),N 为元素个数,B 为桶数

分析

假设记录 \(R_i\) 有 r 个键:

  • \(K_i^j\)\(R_i\) 的第 j 位
  • \(K_i^0\)\(R_i\) 的最高位
  • \(K_i^{r-1}\)\(R_i\) 的最低位

对于包含记录 \(R_0, \dots, R_{n-1}\) 的列表,如果满足:

\[ (K_i^0, K_i^1, \dots, K_i^{r-1}) \le (K_{i + 1}^0, K_{i + 1}^r, \dots, K_{i+1}^{r - 1}) \]

也就是说:\(K_i^0 = K_{i+1}^0, \dots, K_i^l, = K_{i+1}^l, K_i^{l+1} < K_{i+1}^{l+1},\ l < r - 1\) ,则称该列表具有词典序

s

例子

对于一副扑克牌(52 张),要求如下:

  • \(K^0\) 排序:根据花色,创建 4 个篮子

  • 对每个篮子单独排序(采取合理的排序方法)

  • \(K^1\) 排序,根据面值,创建13个篮子

  • 再将它们按上一步分出来的顺序合并成一堆

  • 再创建 4 个桶,重新排序

评论