数据结构与算法系列之一：八大排序综述

[toc]

前言

剑指offer刷完了，是时候总结一波数据结构与算法了。本系列文章暂定包括数据结构中树和图的各种操作，以及查找、排序等基本算法和动态规划等高级算法。本系列文章只是作为总结性的文献，为自己日后的面试做准备。

概述

直接引自维基百科：排序算法。总结性强。

在计算机科学与数学中，一个排序算法（英语：Sorting algorithm）是一种能将一串数据依照特定排序方式进行排列的一种算法。最常用到的排序方式是数值顺序以及字典顺序。有效的排序算法在一些算法（例如搜索算法与合并算法）中是重要的，如此这些算法才能得到正确解答。排序算法也用在处理文字数据以及产生人类可读的输出结果。基本上，排序算法的输出必须遵守下列两个原则：

输出结果为递增序列（递增是针对所需的排序顺序而言）
输出结果是原输入的一种排列、或是重组

虽然排序算法是一个简单的问题，但是从计算机科学发展以来，在此问题上已经有大量的研究。举例而言，冒泡排序在1956年就已经被研究。虽然大部分人认为这是一个已经被解决的问题，有用的新算法仍在不断的被发明。（例子：图书馆排序在2004年被发表）

分类

在计算机科学所使用的排序算法通常被分类为：

计算的时间复杂度（最差、平均、和最好性能），依据列表（list）的大小(n)。一般而言，好的性能是O(n log n)，坏的性能是O(n2)。对于一个排序理想的性能是O(n)，但平均而言不可能达到。基于比较的排序算法对大多数输入而言至少需要O(n log n)。
内存使用量（以及其他电脑资源的使用）
稳定性：稳定排序算法会让原本有相等键值的纪录维持相对次序。也就是如果一个排序算法是稳定的，当有两个相等键值的纪录R和S，且在原本的列表中R出现在S之前，在排序过的列表中R也将会是在S之前。
依据排序的方法：插入、交换、选择、合并等等。

稳定性

当相等的元素是无法分辨的，比如像是整数，稳定性并不是一个问题。然而，假设以下的数对将要以他们的第一个数字来排序。

1	(4, 1) (3, 1) (3, 7)（5, 6）

在这个状况下，有可能产生两种不同的结果，一个是让相等键值的纪录维持相对的次序，而另外一个则没有：

1 2	(3, 1) (3, 7) (4, 1) (5, 6) （维持次序） (3, 7) (3, 1) (4, 1) (5, 6) （次序被改变）

不稳定排序算法可能会在相等的键值中改变纪录的相对次序，但是稳定排序算法从来不会如此。不稳定排序算法可以被特别地实现为稳定。实现的一个方式是人工扩充键值的比较（比如上面的比较中加入第二个标准：第二个键值的大小），从而在键值相同的两个对象之间进行比较时，使用在原先数据次序中的条目。然而，要记录这种次序通常牵涉到额外的空间负担。

排序算法列表

在这个表格中，n是要被排序的纪录数量以及k是不同键值的数量。

稳定的排序

冒泡排序（bubble sort）— O(n2)
插入排序（insertion sort）— O(n2)
鸡尾酒排序（cocktail sort）— O(n2)
桶排序（bucket sort）— O(n)；需要O(k)额外空间
计数排序（counting sort）— O(n+k)；需要O(n+k)额外空间
归并排序（merge sort）— O(n log n)；需要O(n)额外空间
原地归并排序 — O(n log2 n)如果使用最佳的现在版本
二叉排序树排序（binary tree sort）— O(n log n)期望时间；O(n2)最坏时间；需要O(n)额外空间
鸽巢排序（pigeonhole sort）— O(n+k)；需要O(k)额外空间
基数排序（radix sort）— O(n·k)；需要O(n)额外空间
侏儒排序（gnome sort）— O(n2)
图书馆排序（library sort）— O(n log n)期望时间；O(n2)最坏时间；需要(1+ε)n额外空间
块排序（block sort）— O(n log n)

不稳定的排序

选择排序（selection sort）— O(n2)
希尔排序（shell sort）— O(n log2 n)如果使用最佳的现在版本
Clover排序算法（Clover sort）— O(n)期望时间，O(n2)最坏情况
梳排序 — O(n log n)
堆排序（heap sort）— O(n log n)
平滑排序（smooth sort）— O(n log n)
快速排序（quick sort）— O(n log n)期望时间，O(n2)最坏情况；对于大的、随机数列表一般相信是最快的已知排序
内省排序（introsort）—O (n log n)
耐心排序（patience sort）— O(n log n + k)最坏情况时间，需要额外的O(n + k)空间，也需要找到最长的递增子序列（longest increasing subsequence）

不实用的排序

Bogo排序 — O(n × n!)，最坏的情况下期望时间为无穷
Stupid排序 — O(n3);递归版本需要O(n2)额外内存
珠排序（bead sort）— O(n) or O(√n),但需要特别的硬件
煎饼排序 — O(n),但需要特别的硬件
臭皮匠排序（stooge sort）算法简单，但需要约n^2.7的时间

==概述到此结束，下面分八篇文章依次对典型的八种排序进行图文并茂的讲解和c++实现。==

先贴一下八大排序的性能概括图：

再贴出来以后要用到的main函数和头文件。

#include <iostream>
#include <algorithm>
#include <stdexcept>
#include <stack>
#include <cstdio>
#include <cstring>
using namespace std; 
#define M 5

int main() { 
	int arr[] = {2,4,6,8,9,7,5,3,1};
	int len = sizeof(arr) / sizeof(*arr);
//	double arr[] = {4.5, 2.3,6.7, 3.5, 1.1};
//	const int len = sizeof(arr) / sizeof(arr[0]);
//	BubbleSort(arr, len);
//	BubbleSort1(arr, len);
//	BubbleSort2(arr, len);
//	BubbleSort3(arr, len);
//	InsertSort(arr, len);
//	ShellSort(arr, len);	
//	QuickSort(arr, len);
//	QuickSortIteration(arr, len);
//	SelectSort(arr, len);	
//	HeapSort(arr, len);		
//	MergeSort(arr, len); 
	MergeSortIteration(arr, len);

	for(auto v : arr){
		cout << v << " ";
	} cout << endl;
}

最后就要打开传送门了：

csdn告诉我今天上传博客的次数到达上限了，然而我还有两个没有上传，那我只好先引流到我的个人博客了。

插入排序：（有序区，无序区）。把无序区的第一个元素插入到有序区的合适的位置。对数组：比较得少，换得多。
希尔排序：每一轮按照事先决定的间隔进行插入排序，间隔会依次缩小，最后一次一定要是1。
选择排序：（有序区，无序区）。在无序区里找一个最小的元素跟在有序区的后面。对数组：比较得多，换得少。
堆排序：（最大堆，有序区）。
从堆顶把根卸出来放在有序区之前，再恢复堆。
冒泡排序：（无序区，有序区）。从无序区通过交换找出最大元素放到有序区前端。
快速排序：（小数，基准元素，大数）。
在区间中随机挑选一个元素作基准，将小于基准的元素放在基准之前，大于基准的元素放在基准之后，再分别对小数区与大数区进行排序。
归并排序：把数据分为两段，从两段中逐个选最小的元素移入新数据段的末尾。
可从上到下或从下到上进行。
基数排序：一种多关键字的排序算法，可用桶排序实现。

参考链接：
维基百科
 数据结构与算法可视化可视化
 数据结构与算法
 排序算法可视化
 经典排序算法总结与实现

转自https://blog.csdn.net/u011475210