[toc]
堆排序
前言
建议先看排序综述,传送门:数据结构与算法系列之一:八大排序综述。
简介
堆排序(Heapsort)是指利用堆这种数据结构所设计的一种排序算法。堆积是一个近似完全二叉树的结构,并同时满足堆积的性质:即子结点的键值或索引总是小于(或者大于)它的父节点。
通常堆是通过一维数组来实现的。在数组起始位置为0的情形中:
- 父节点i的左子节点在位置 ${\displaystyle (2i+1)}$。
- 父节点i的右子节点在位置 ${\displaystyle (2i+2)}$。
- 子节点i的父节点在位置 ${\displaystyle floor((i-1)/2)}$。
在堆的数据结构中,堆中的最大值总是位于根节点(在优先队列中使用堆的话堆中的最小值位于根节点)。堆中定义以下几种操作:
- 最大堆调整(Max_Heapify):将堆的末端子节点作调整,使得子节点永远小于父节点。
- 创建最大堆(Build_Max_Heap):将堆所有数据重新排序。
- 堆排序(HeapSort):移除位在第一个数据的根节点,并做最大堆调整的递归运算。
步骤
基于以上堆相关的操作,我们可以很容易的定义堆排序。例如,假设我们已经读入一系列数据并创建了一个堆,一个最直观的算法就是反复的调用del_max()函数,因为该函数总是能够返回堆中最大的值,然后把它从堆中删除,从而对这一系列返回值的输出就得到了该序列的降序排列。真正的原地堆排序使用了另外一个小技巧。堆排序的过程是:
- 创建一个堆 ${\displaystyle H[0..n-1]}$。
- 把堆首(最大值)和堆尾互换。
- 把堆的尺寸缩小1,并调用shift_down(0),目的是把新的数组顶端数据调整到相应位置。
- 重复步骤2,直到堆的尺寸为1。
演示
wikipedia的大数据规模演示:
代码
递归版
1 | /* |
迭代版
1 | /* |
算法复杂度
- 数据结构 数组
- 最坏时间复杂度 ${\displaystyle O(n\log n)}$
- 最优时间复杂度 ${\displaystyle O(n\log n)}$
- 平均时间复杂度 ${\displaystyle O(n\log n)}$
- 空间复杂度 ${\displaystyle O(n)}$ total, ${\displaystyle O(1)}$ auxiliary
分析
原地堆排序已经是空间优化版本了,因为它不再需要申请额外的空间。
整个算法的过程分为建堆和排序两个过程,首先对现有数组建立最大堆,然后一边提取堆顶的最大值,一边减小堆的尺寸,最后堆尺寸为1时,排序也就完成了。如果大家对整个算法的执行过程不太了解,可以看一下下面这两张图,第一张是建堆的过程示意图,第二张是排序的过程示意图。图片来自:http://bubkoo.com/2014/01/14/sort-algorithm/heap-sort/
系列教程持续发布中,欢迎订阅、关注、收藏、评论、点赞哦~~( ̄▽ ̄~)~
完的汪(∪。∪)。。。zzz