[toc]
前言
剑指offer刷完了,是时候总结一波数据结构与算法了。本系列文章暂定包括数据结构中树和图的各种操作,以及查找、排序等基本算法和动态规划等高级算法。本系列文章只是作为总结性的文献,为自己日后的面试做准备。
概述
直接引自维基百科:排序算法。总结性强。
在计算机科学与数学中,一个排序算法(英语:Sorting algorithm)是一种能将一串数据依照特定排序方式进行排列的一种算法。最常用到的排序方式是数值顺序以及字典顺序。有效的排序算法在一些算法(例如搜索算法与合并算法)中是重要的,如此这些算法才能得到正确解答。排序算法也用在处理文字数据以及产生人类可读的输出结果。基本上,排序算法的输出必须遵守下列两个原则:
- 输出结果为递增序列(递增是针对所需的排序顺序而言)
- 输出结果是原输入的一种排列、或是重组
虽然排序算法是一个简单的问题,但是从计算机科学发展以来,在此问题上已经有大量的研究。举例而言,冒泡排序在1956年就已经被研究。虽然大部分人认为这是一个已经被解决的问题,有用的新算法仍在不断的被发明。(例子:图书馆排序在2004年被发表)
分类
在计算机科学所使用的排序算法通常被分类为:
- 计算的时间复杂度(最差、平均、和最好性能),依据列表(list)的大小(n)。一般而言,好的性能是O(n log n),坏的性能是O(n2)。对于一个排序理想的性能是O(n),但平均而言不可能达到。基于比较的排序算法对大多数输入而言至少需要O(n log n)。
- 内存使用量(以及其他电脑资源的使用)
- 稳定性:稳定排序算法会让原本有相等键值的纪录维持相对次序。也就是如果一个排序算法是稳定的,当有两个相等键值的纪录R和S,且在原本的列表中R出现在S之前,在排序过的列表中R也将会是在S之前。
- 依据排序的方法:插入、交换、选择、合并等等。
稳定性
当相等的元素是无法分辨的,比如像是整数,稳定性并不是一个问题。然而,假设以下的数对将要以他们的第一个数字来排序。
1 | (4, 1) (3, 1) (3, 7)(5, 6) |
在这个状况下,有可能产生两种不同的结果,一个是让相等键值的纪录维持相对的次序,而另外一个则没有:
1 | (3, 1) (3, 7) (4, 1) (5, 6) (维持次序) |
不稳定排序算法可能会在相等的键值中改变纪录的相对次序,但是稳定排序算法从来不会如此。不稳定排序算法可以被特别地实现为稳定。实现的一个方式是人工扩充键值的比较(比如上面的比较中加入第二个标准:第二个键值的大小),从而在键值相同的两个对象之间进行比较时,使用在原先数据次序中的条目。然而,要记录这种次序通常牵涉到额外的空间负担。
排序算法列表
在这个表格中,n是要被排序的纪录数量以及k是不同键值的数量。
稳定的排序
- 冒泡排序(bubble sort)— O(n2)
- 插入排序(insertion sort)— O(n2)
- 鸡尾酒排序(cocktail sort)— O(n2)
- 桶排序(bucket sort)— O(n);需要O(k)额外空间
- 计数排序(counting sort)— O(n+k);需要O(n+k)额外空间
- 归并排序(merge sort)— O(n log n);需要O(n)额外空间
- 原地归并排序 — O(n log2 n)如果使用最佳的现在版本
- 二叉排序树排序(binary tree sort)— O(n log n)期望时间;O(n2)最坏时间;需要O(n)额外空间
- 鸽巢排序(pigeonhole sort)— O(n+k);需要O(k)额外空间
- 基数排序(radix sort)— O(n·k);需要O(n)额外空间
- 侏儒排序(gnome sort)— O(n2)
- 图书馆排序(library sort)— O(n log n)期望时间;O(n2)最坏时间;需要(1+ε)n额外空间
- 块排序(block sort)— O(n log n)
不稳定的排序
- 选择排序(selection sort)— O(n2)
- 希尔排序(shell sort)— O(n log2 n)如果使用最佳的现在版本
- Clover排序算法(Clover sort)— O(n)期望时间,O(n2)最坏情况
- 梳排序 — O(n log n)
- 堆排序(heap sort)— O(n log n)
- 平滑排序(smooth sort)— O(n log n)
- 快速排序(quick sort)— O(n log n)期望时间,O(n2)最坏情况;对于大的、随机数列表一般相信是最快的已知排序
- 内省排序(introsort)—O (n log n)
- 耐心排序(patience sort)— O(n log n + k)最坏情况时间,需要额外的O(n + k)空间,也需要找到最长的递增子序列(longest increasing subsequence)
不实用的排序
- Bogo排序 — O(n × n!),最坏的情况下期望时间为无穷
- Stupid排序 — O(n3);递归版本需要O(n2)额外内存
- 珠排序(bead sort)— O(n) or O(√n),但需要特别的硬件
- 煎饼排序 — O(n),但需要特别的硬件
- 臭皮匠排序(stooge sort)算法简单,但需要约n^2.7的时间
==概述到此结束,下面分八篇文章依次对典型的八种排序进行图文并茂的讲解和c++实现。==
先贴一下八大排序的性能概括图:
再贴出来以后要用到的main函数和头文件。
1 |
|
最后就要打开传送门了:
csdn告诉我今天上传博客的次数到达上限了,然而我还有两个没有上传,那我只好先引流到我的个人博客了。
- 插入排序:(有序区,无序区)。把无序区的第一个元素插入到有序区的合适的位置。对数组:比较得少,换得多。
- 希尔排序:每一轮按照事先决定的间隔进行插入排序,间隔会依次缩小,最后一次一定要是1。
- 选择排序:(有序区,无序区)。在无序区里找一个最小的元素跟在有序区的后面。对数组:比较得多,换得少。
- 堆排序:(最大堆,有序区)。
从堆顶把根卸出来放在有序区之前,再恢复堆。 - 冒泡排序:(无序区,有序区)。从无序区通过交换找出最大元素放到有序区前端。
- 快速排序:(小数,基准元素,大数)。
在区间中随机挑选一个元素作基准,将小于基准的元素放在基准之前,大于基准的元素放在基准之后,再分别对小数区与大数区进行排序。 - 归并排序:把数据分为两段,从两段中逐个选最小的元素移入新数据段的末尾。
可从上到下或从下到上进行。 - 基数排序:一种多关键字的排序算法,可用桶排序实现。
参考链接:
维基百科
数据结构与算法可视化可视化
数据结构与算法
排序算法可视化
经典排序算法总结与实现