数据结构_ C++语言版第三版 PDF - 邓俊辉

§3.1 从向量刡列表第3章列表上一章介绍的向量结构中，各数据项的物理存放位置与逻辑次序完全对应，故可通过秩直接访问对应的元素，此即所谓“循秩访问”（call-by-rank）。这种访问方式，如同根据具体的城市名、街道名和门牌号，直接找到某人。本章将要介绍的列...

§3.1 从向量刡列表第3章列表上一章介绍的向量结构中，各数据项的物理存放位置与逻辑次序完全对应，故可通过秩直接访问对应的元素，此即所谓“循秩访问”（call-by-rank）。这种访问方式，如同根据具体的城市名、街道名和门牌号，直接找到某人。本章将要介绍的列表，与向量同属序列结构的范畴，其中的元素也构成一个线性逻辑次序；但与向量极为不同的是，元素的物理地址可以任意。为保证对列表元素访问的可行性，逻辑上互为前驱和后继的元素之间，应维护某种索引关系。这种索引关系，可抽象地理解为被索引元素的位置（position），故列表元素是“循位置访问” （call-by-position）的；也可形象地理解为通往被索引元素的链接（link），故亦称作“循链接访问”（call-by-link）。这种访问方式，如同通过你的某位亲朋，找到他/她的亲朋、亲朋的亲朋、...。注意，向量中的秩同时对应于逻辑和物理次序，而位置仅对应于逻辑次序。本章的讲解，将围绕列表结构的高效实现逐步展开，包括其ADT接口规范以及对应的算法。此外还将针对有序列表，系统地介绍排序等经典算法，并就其性能做一分析和对比。 §3.1 从向量到列表不同数据结构内部的存储与组织方式各异，其操作接口的使用方式及时空性能也不尽相同。在设计或选用数据结构时，应从实际应用的需求出发，先确定功能规范及性能指标。比如，引入列表结构的目的，就在于弥补向量结构在解决某些应用问题时，在功能及性能方面的不足。二者之间的差异，表面上体现于对外的操作方式，但根源则在于其内部存储方式的不同。 3.1.1 从静态到动态数据结构支持的操作，通常无非静态和动态两类：前者仅从中获取信息，后者则会修改数据结构的局部甚至整体。以第2章基于数组实现的向量结构为例，其size()和get()等静态操作均可在常数时间内完成，而insert()和remove()等动态操作却都可能需要线性时间。究其原因，在于“各元素物理地址连续”的约定此即所谓的“静态存储”策略。得益于这种策略，可在O(1)时间内由秩确定向量元素的物理地址；但反过来，在添加（删除）元素之前（之后），又不得不移动O(n)个后继元素。可见，尽管如此可使静态操作的效率达到极致，但就动态操作而言，局部的修改可能引起大范围甚至整个数据结构的调整。列表（list）结构尽管也要求各元素在逻辑上具有线性次序，但对其物理地址却未作任何限制此即所谓“动态存储”策略。具体地，在其生命期内，此类数据结构将随着内部数据的 66 需要，相应地分配或回收局部的数据空间。如此，元素之间的逻辑关系得以延续，却不必与其物理次序相关。作为补偿，此类结构将通过指针或引用等机制，来确定各元素的实际物理地址。例如，链表（linked list）就是一种典型的动态存储结构。其中的数据，分散为一系列称作节点（node）的单位，节点之间通过指针相互索引和访问。为了引入新节点或删除原有节点，只需在局部，调整少量相关节点之间的指针。这就意味着，采用动态存储策略，至少可以大大降低动态操作的成本。第3章列表 §3.2 接口 3.1.2 由秩到位置改用以上动态存储策略之后，在提高动态操作效率的同时，却又不得不舍弃原静态存储策略中循秩访问的方式，从而造成静态操作性能的下降。以采用动态存储策略的线性结构（比如链表）为例。尽管按照逻辑次序，每个数据元素依然具有秩这一指标，但为了访问秩为r的元素，我们只能顺着相邻元素之间的指针，从某一端出发逐个扫描各元素，经过r步迭代后才能确定该元素的物理存储位置。这意味着，原先只需O(1)时间的静态操作，此时的复杂度也将线性正比于被访问元素的秩，在最坏情况下等于元素总数n；即便在各元素被访问概率相等的情况下，平均而言也需要O(n)时间。对数据结构的访问方式，应与其存储策略相一致。此时，既然继续延用循秩访问的方式已非上策，就应更多地习惯于通过位置，来指代并访问动态存储结构中的数据元素。与向量中秩的地位与功能类似，列表中的位置也是指代各数据元素的一个标识性指标，借助它可以便捷地（比如在常数时间内）得到元素的物理存储地址。各元素的位置，通常可表示和实现为联接于元素之间的指针或引用。因此，基于此类结构设计算法时，应更多地借助逻辑上相邻元素之间的位置索引，以实现对目标元素的快速定位和访问，并进而提高算法的整体效率。 3.1.3 列表与向量一样，列表也是由具有线性逻辑次序的一组元素构成的集合： L = { a0, a1,..., an-1 } 列表是链表结构的一般化推广，其中的元素称作节点（node），分别由特定的位置或链接指代。与向量一样，在元素之间，也可定义前驱、直接前驱，以及后继、直接后继等关系；相对于任意元素，也有定义对应的前缀、后缀等子集。 §3.2 接口如上所述，作为列表的基本组成单位，列表节点除需保存对应的数据项，还应记录其前驱和后继的位置，故需将这些信息及相关操作组成列表节点对象，然后参与列表的构建。本节将给出列表节点类与列表类的接口模板类描述，稍后逐一讲解各接口的具体实现。 3.2.1 列表节点 ADT接口作为一种抽象数据类型，列表节点对象应支持以下操作接口。表3.1 列表节点ADT支持癿操作接口操作接口功能 data() 弼前节点所存数据对象 67 pred() 弼前节点前驱节点癿位置 succ() 弼前节点后继节点癿位置 insertAsPred(e) 揑入前驱节点，存入被引用对象e，迒回新节点位置 insertAsSucc(e) 揑入后继节点，存入被引用对象e，迒回新节点位置 §3.2 接口第3章列表 ListNode模板类按照表3.1所定义的ADT接口，可定义列表节点模板类如代码3.1所示。出于简洁与效率的考虑，这里并未对ListNode对象做封装处理。列表节点数据项的类型，通过模板参数T指定。 1 typedef int Rank; //秩 2 #define ListNodePosi(T) ListNode* //列表节点位置 3 4 template struct ListNode { //列表节点模板类（以双向链表形式实现） 5 // 成员 6 T data; ListNodePosi(T) pred; ListNodePosi(T) succ; //数值、前驱、后继 7 // 极造函数 8 ListNode() {} //针对header和trailer癿极造 9 ListNode( T e, ListNodePosi(T) p = NULL, ListNodePosi(T) s = NULL) 10 : data(e), pred(p), succ(s) {} //默讣极造器 11 // 操作接口 12 ListNodePosi(T) insertAsPred(T const& e); //紧靠弼前节点乀前揑入新节点 13 ListNodePosi(T) insertAsSucc(T const& e); //紧随弼前节点乀后揑入新节点 14 }; 代码3.1 列表节点模板类① 每个节点都存有数据对象data。为保证叙述简洁，在不致歧义的前提下，本书将不再区分节点及其对应的data对象。此外，每个节点还设有指针pred和succ，分别指向其前驱和后继。为了创建一个列表节点对象，只需根据所提供的参数，分别设置节点内部的各个变量。其中前驱、后继节点的位置指针若未予指定，则默认取作NULL。 3.2.2 列表 ADT接口作为一种抽象数据类型，列表对象应支持以下操作接口。表3.2 列表ADT支持癿操作接口操作接口功能适用对象 size() 报告列表弼前癿觃模（节点总数）列表 first()、last() 迒回首、末节点癿位置列表 insertAsFirst(e) 将e弼作首、末节点揑入列表 insertAsLast(e) insertBefore(p, e) 将e弼作节点p癿直接前驱、后继揑入列表 insertAfter(p, e) 68 ① 请注意，返里所“定丿”癿ListNodePosi(T)幵非真正意丿上“列表节点位置”类型。巧合癿是，就在本书第1版即将付印乀际，C++.0x标准终亍被ISO接纳。新标准所拓展癿特性乀一，就是对模板删名（template alias）等语法形式癿支持。因此可以期望在丌丽癿将来， C++编译器将能够支持如下更为直接和简明癿描述和实现： template typedef ListNode* ListNodePosi; 第3章列表 §3.2 接口操作接口功能适用对象 remove(p) 初除位置p处癿节点，迒回其数值列表 disordered() 刞断所有节点是否已按非降序排列列表 sort() 调整各节点癿位置，使乀按非降序排列列表 find(e) 查找目标元素e，失败时迒回NULL 列表 search(e) 查找目标元素e，迒回丌大亍e且秩最大癿节点有序列表 deduplicate() 剔除重复节点列表 uniquify() 剔除重复节点有序列表 traverse() 遍历幵统一处理所有节点，处理斱法由函数对象指定列表请留意用以指示插入和删除操作位置的节点p。这里约定，它或者在此前经查找已经确定，或者从此前的其它操作返回或沿用。这些也是列表类结构的典型操作方式。这里也设置一个disordered()接口，以判断列表是否已经有序。同时，也分别针对有序和无序列表，提供了去重操作的两个版本（deduplicate()和uniquify()），以及查找操作的两个版本（find()和search()）。与向量一样，有序列表的唯一化，比无序列表效率更高。然而正如我们将要看到的，由于只能通过位置指针以局部移动的方式访问节点，尽管有序列表中节点在逻辑上始终按照大小次序排列，其查找操作的效率并没有实质改进（习题[3-1]）。 List模板类按照表3.2定义的ADT接口，可定义List模板类如下。 1 #include "listNode.h" //引入列表节点类 2 3 template class List { //列表模板类 4 5 private: 6 int _size; ListNodePosi(T) header; ListNodePosi(T) trailer; //觃模、头哨兵、尾哨兵 7 8 protected: 9 void init(); //列表创建时癿刜始化 10 int clear(); //清除所有节点 11 void copyNodes(ListNodePosi(T), int); //复刢列表中自位置p起癿n顷 12 void merge(ListNodePosi(T)&, int, List&, ListNodePosi(T), int); //有序列表匙间弻幵 13 void mergeSort(ListNodePosi(T)&, int); //对从p开始连续癿n个节点弻幵排序 14 void selectionSort(ListNodePosi(T), int); //对从p开始连续癿n个节点选择排序 15 void insertionSort(ListNodePosi(T), int); //对从p开始连续癿n个节点揑入排序 16 17 public: 69 18 // 极造函数 19 List() { init(); } //默讣 20 List(List const& L); //整体复刢列表L 21 List(List const& L, Rank r, int n); //复刢列表L中自第r顷起癿n顷 22 List(ListNodePosi(T) p, int n); //复刢列表中自位置p起癿n顷 §3.2 接口第3章列表 23 // 枂极函数 24 ~List(); //释放（包含头、尾哨兵在内癿）所有节点 25 // 叧读讵问接口 26 Rank size() const { return _size; } //觃模 27 bool empty() const { return _size succ; } //首节点位置 30 ListNodePosi(T) last() const { return trailer->pred; } //末节点位置 31 bool valid(ListNodePosi(T) p) //刞断位置p是否对外合法 32 { return p && (trailer != p) && (header != p); } //将头、尾节点等同亍NULL 33 int disordered() const; //刞断列表是否已排序 34 ListNodePosi(T) find(T const& e) const //无序列表查找 35 { return find(e, _size, trailer); } 36 ListNodePosi(T) find(T const& e, int n, ListNodePosi(T) p) const; //无序匙间查找 37 ListNodePosi(T) search(T const& e) const //有序列表查找 38 { return search(e, _size, trailer); } 39 ListNodePosi(T) search(T const& e, int n, ListNodePosi(T) p) const; //有序匙间查找 40 ListNodePosi(T) selectMax(ListNodePosi(T) p, int n); //在p及其前n-1个后继中选出最大者 41 ListNodePosi(T) selectMax() { return selectMax(header->succ, _size); } //整体最大者 42 // 可写讵问接口 43 ListNodePosi(T) insertAsFirst(T const& e); //将e弼作首节点揑入 44 ListNodePosi(T) insertAsLast(T const& e); //将e弼作末节点揑入 45 ListNodePosi(T) insertBefore(ListNodePosi(T) p, T const& e); //将e弼作p癿前驱揑入 46 ListNodePosi(T) insertAfter(ListNodePosi(T) p, T const& e); //将e弼作p癿后继揑入 47 T remove(ListNodePosi(T) p); //初除合法位置p处癿节点,迒回被初除节点 48 void merge(List& L) { merge(first(), size, L, L.first(), L._size); } //全列表弻幵 49 void sort(ListNodePosi(T) p, int n); //列表匙间排序 50 void sort() { sort(first(), _size); } //列表整体排序 51 int deduplicate(); //无序去重 52 int uniquify(); //有序去重 53 void reverse(); //前后倒置（习题） 54 // 遍历 55 void traverse(void (*)(T&)); //遍历，依次实斲visit操作（函数指针，叧读戒尿部性修改） 56 template //操作器 57 void traverse(VST&); //遍历，依次实斲visit操作（函数对象，可全尿性修改） 58 }; //List 70 代码3.2 列表模板类由代码3.2可见，列表结构的实现方式与第2章的向量结构颇为相似：通过模板参数T指定列表元素的类型（同时亦为代码3.1中列表节点数据项的类型）；在内部设置私有变量以记录当前规模等状态信息；基于多种排序算法提供统一的sort()接口，以将列表转化为有序列表。以下，分别介绍列表的内部结构、基本接口，以及主要算法的具体实现。第3章列表 §3.3 列表 §3.3 列表 3.3.1 头、尾节点 List对象的内部组成及逻辑结构如图3.1所示，其中私有的头节点（header）和尾节点（trailer）始终存在，但对外并不可见。对外部可见的数据节点如果存在，则其中的第一个和最后一个节点分别称作首节点（first node）和末节点（last node）。图3.1 首（末）节点是头（尾）节点癿直接后继（前驱）就内部结构而言，头节点紧邻于首节点之前，尾节点紧邻于末节点之后。这类经封装之后从外部不可见的节点，称作哨兵节点（sentinel node）。由代码3.2中List::valid()关于合法节点位置的判别准则可见，此处的两个哨兵节点从外部被等效地视作NULL。设置哨兵节点之后，对于从外部可见的任一节点而言，其前驱和后继在列表内部都必然存在，故可简化算法的描述与实现。比如，在代码3.2中为实现first()和last()操作，只需直接返回 header->succ或trailer->pred。此外更重要地，哨兵节点的引入，也使得相关算法不必再对各种边界退化情况做专门的处理，从而避免出错的可能，我们稍后将对此有更实际的体会。尽管哨兵节点也需占用一定的空间，但只不过是常数规模，其成本远远低于由此带来的便利。 3.3.2 默认构造方法创建List对象时，默认构造方法将调用如代码3.3所示的统一初始化过程init()，在列表内部创建一对头、尾哨兵节点，并适当地设置其前驱、后继指针构成一个双向链表。 1 template void List::init() { //列表刜始化，在创建列表对象时统一调用 2 header = new ListNode; //创建头哨兵节点 3 trailer = new ListNode; //创建尾哨兵节点 4 header->succ = trailer; header->pred = NULL; 5 trailer->pred = header; trailer->succ = NULL; 6 _size = 0; //记弽觃模 7 } 代码3.3 列表类内部斱法init() 如图3.2所示，该链表对外的有效部分初始为空，哨兵节点对外不可见，此后引入的新节点都将陆续插入于这一对哨兵节点之间。 71 图3.2 刚创建癿List对象在列表的其它构造方法中，内部变量的初始化过程与此相同，因此都可统一调用init()过程。该过程仅涉及常数次基本操作，共需运行常数时间。 §3.3 列表第3章列表 3.3.3 由秩到位置的转换鉴于偶尔可能需要通过秩来指定列表节点，可通过重载操作符“[]”,提供一个转换接口。 1 template //重载下标操作符，以通过秩直接讵问列表节点（虽斱便，效率低，需慎用） 2 T& List::operator[](Rank r) const { //assert: 0 succ; //顸数第r个节点即是 5 return p->data; //目标节点，迒回其中所存元素 6 } 代码3.4 重轲列表类癿下标操作符具体地如代码3.4所示，为将任意指定的秩r转换为列表中对应的元素，可从首节点出发，顺着后继指针前进r步。只要秩r合法，该算法的正确性即一目了然。其中每步迭代仅需常数时间，故该算法的总体运行时间应为O(r + 1)，线性正比于目标节点的秩。相对于向量同类接口的O(1)复杂度，列表的这一效率十分低下其根源在于，列表元素的存储和访问方式已与向量截然不同。诚然，当r大于n/2时，从trailer出发沿pred指针逆行查找，可以在一定程度上减少迭代次数，但就总体的平均效率而言，这一改进并无实质意义。 3.3.4 查找实现在代码3.2中，列表ADT针对整体和区间查找，重载了操作接口find(e)和find(e, p, n)。其中，前者作为特例，可以直接调用后者。因此，只需如代码3.5所示，实现后一接口。 1 template //在无序列表内节点p（可能是trailer）癿n个（真）前驱中，找刡等亍e癿最后者 2 ListNodePosi(T) List::find(T const& e, int n, ListNodePosi(T) p) const { //0insertAsSucc(e); } //e弼作首节点揑入 3 第3章列表 §3.3 列表 4 template ListNodePosi(T) List::insertAsLast(T const& e) 5 { _size++; return trailer->insertAsPred(e); } //e弼作末节点揑入 6 7 template ListNodePosi(T) List::insertBefore(ListNodePosi(T) p, T const& e) 8 { _size++; return p->insertAsPred(e); } //e弼作p癿前驱揑入 9 10 template ListNodePosi(T) List::insertAfter(ListNodePosi(T) p, T const& e) 11 { _size++; return p->insertAsSucc(e); } //e弼作p癿后继揑入代码3.6 列表节点揑入接口可见，这些接口的实现，都可转化为列表节点对象的前插入或后插入接口。前插入将新元素e作为当前节点的前驱插至列表的过程，可描述和实现如代码3.7所示。 1 template //将e紧靠弼前节点乀前揑入亍弼前节点所属列表（讴有哨兵头节点header） 2 ListNodePosi(T) ListNode::insertAsPred(T const& e) { 3 ListNodePosi(T) x = new ListNode(e, pred, this); //创建新节点 4 pred->succ = x; pred = x; //讴置正向链接 5 return x; //迒回新节点癿位置 6 } 代码3.7 ListNode::insertAsPred()算法图3.3给出了整个操作的具体过程。插入新节点之前，列表局部的当前节点及其前驱如图(a) 所示。该算法首先如图(b)所示创建新节点new，构造函数同时将其数据项置为e，并令其后继链接succ指向当前节点，令其前驱链接pred指向当前节点的前驱节点。随后如图(c)所示，使new 成为当前节点前驱节点的后继，使new成为当前节点的前驱（次序不能颠倒）。最终如图(d)所示，经过如此调整，新节点即被顺利地插至列表的这一局部。图3.3 ListNode::insertAsPred()算法 73 请注意，列表规模记录的更新由代码3.6中的上层调用者负责。另外，得益于头哨兵节点的存在，即便当前节点为列表的首节点，其前驱也如图(a)所示必然存在，故不必另做特殊处理。当然，在当前节点即首节点时，前插入接口等效于List::insertAsFirst()。 §3.3 列表第3章列表后插入将新元素e作为当前节点的后继插至列表的过程，可描述和实现如代码3.8所示。 1 template //将e紧随弼前节点乀后揑入亍弼前节点所属列表（讴有哨兵尾节点trailer） 2 ListNodePosi(T) ListNode::insertAsSucc(T const& e) { 3 ListNodePosi(T) x = new ListNode(e, this, succ); //创建新节点 4 succ->pred = x; succ = x; //讴置逆向链接 5 return x; //迒回新节点癿位置 6 } 代码3.8 ListNode::insertAsSucc()算法后插入的操作过程以及最终效果与前插入完全对称，不再赘述。复杂度上述两种插入操作过程，仅涉及局部的两个原有节点和一个新节点，且不含任何迭代或递归。若假设当前节点已经定位，不计入此前的查找所消耗的时间，则它们都可在常数时间内完成。 3.3.6 基于复制的构造与向量一样，列表的内部结构也是动态创建的，故利用默认的构造方法并不能真正地完成新列表的复制创建。为此，需要专门编写相应的构造方法，通过复制某一已有列表来构造新列表。 copyNodes() 尽管这里提供了多种形式，以允许对原列表的整体或局部复制，但其实质过程均大同小异，都可概括和转化为如代码3.9所示的底层内部方法copyNodes()。在输入参数合法的前提下， copyNodes()首先调用init()方法，创建头、尾哨兵节点并做相应的初始化处理，然后自p所指节点起，从原列表中取出n个相邻的节点，并逐一作为末节点插至新列表中。 1 template //列表内部斱法：复刢列表中自位置p起癿n顷 2 void List::copyNodes(ListNodePosi(T) p, int n) { //p合法，且至少有n-1个真后继节点 3 init(); //创建头、尾哨兵节点幵做刜始化 4 while(n--) { insertAsLast(p->data); p = p->succ; } //将起自p癿n顷依次作为末节点揑入 5 } 代码3.9 列表类内部斱法copyNodes() 根据此前的分析，init()操作以及各步迭代中的插入操作均只需常数时间，故copyNodes() 过程总体的运行时间应为O(n + 1)，线性正比于待复制列表区间的长度n。基于复制的构造如代码3.10所示，基于上述copyNodes()方法可以实现多种接口，通过复制已有列表的区 74 间或整体，构造出新列表。其中，为了复制列表L中自秩r起的n个相邻节点，List(L, r, n)需借助重载后的下标操作符，找到待复制区间起始节点的位置，然后再以此节点作为参数调用 copyNodes()。根据3.3.3节的分析结论，需要花费O(r + 1)的时间才能将r转换为起始节点的位置，故该复制接口的总体复杂度应为O(r + n + 1)，线性正比于被复制节点的最高秩。由此也可再次看出，在诸如列表之类采用动态存储策略的结构中，循秩访问远非有效的方式。第3章列表 §3.3 列表 1 template //assert: p为合法位置，且至少有n-1个后继节点 2 List::List(ListNodePosi(T) p, int n) { copyNodes(p, n); } //复刢列表中自位置p起癿n顷 3 4 template 5 List::List(List const& L) { copyNodes(L.first(), L._size); } //整体复刢列表L 6 7 template //assert: r+n data; //备仹待初除节点癿数值（假定T类型可直接赋值） 3 p->pred->succ = p->succ; p->succ->pred = p->pred; //后继、前驱 4 delete p; _size--; //释放节点，更新觃模 5 return e; //迒回备仹癿数值 6 } 代码3.11 列表节点初除接口remove() 图3.4给出了整个操作的具体过程。删除节点之前，列表在位置p附近的局部如图(a)所示。为了删除位置p处的节点，首先如图(b)所示，令其前驱节点与后继节点相互链接。然后如图(c) 所示，释放掉已经孤立出来的节点p，同时相应地更新列表规模计数器_size。最终如图(d)所示，经过如此调整之后，原节点p即被顺利地从列表中摘除。图3.4 List::remove()算法这里，可以清晰地体会到哨兵节点的作用。不难验证，即便p所指的是列表中唯一对外有效 75 的节点（其前驱和后继都是哨兵节点），remove()算法依然可以正常运转。复杂度以上过程仅涉及常数次基本操作，故若不计入此前为查找并确定位置p所消耗的时间，列表的节点删除操作可在常数时间内完成。 §3.3 列表第3章列表 3.3.8 析构释放资源及清除节点与所有对象一样，列表对象析构时也需如代码3.12所示，将其所占用的资源归还操作系统。 1 template List::~List() //列表枂极器 2 { clear(); delete header; delete trailer; } //清空列表，释放头、尾哨兵节点代码3.12 列表枂极斱法可见，列表的析构需首先调用clear()接口删除并释放所有对外部有效的节点，然后释放内部的头、尾哨兵节点。而clear()过程则可描述和实现如代码3.13所示。 1 template int List::clear() { //清空列表 2 int oldSize = _size; 3 while (0 < _size) remove(header->succ); //反复初除首节点，直至列表发空 4 return oldSize; 5 } 代码3.13 列表清空斱法clear() 复杂度这里的时间消耗主要来自clear()操作，该操作通过remove()接口反复删除列表的首节点。因此，clear()方法以及整个析构方法的运行时间应为O(n)，线性正比于列表原先的规模。 3.3.9 唯一化实现旨在剔除无序列表中重复元素的接口deduplicate()，可实现如代码3.14所示。 1 template int List::deduplicate() { //剔除无序列表中癿重复节点 2 if (_size < 2) return 0; //平凡列表自然无重复 3 int oldSize = _size; //记弽原觃模 4 ListNodePosi(T) p = header; Rank r = 0; //p从首节点开始 5 while (trailer != (p = p->succ)) { //依次直刡末节点 6 ListNodePosi(T) q = find(p->data, r, p); //在p癿r个（真）前驱中查找雷同者 7 q ? remove(q) : r++; //若癿确存在，则初除乀；否则秩加一 8 } //assert: 循环过秳中癿仸意时刻，p癿所有前驱互丌相同 9 return oldSize - _size; //列表觃模发化量，即被初除元素总数 10 } 代码3.14 无序列表剔除重复节点接口deduplicate() 76 与算法Vector::deduplicate()（42页代码2.14）类似，这里也是自前向后依次处理各节点p，一旦通过find()接口在p的前驱中查到雷同者，则随即调用remove()接口将其删除。正确性向量与列表中元素的逻辑次序一致，故二者的deduplicate()算法亦具有类似的不变性和单调性（习题[3-4]），故正确性均可保证。第3章列表 §3.4 有序列表复杂度与无序向量的去重算法一样，该算法总共需做O(n)步迭代。由3.3.4节的分析结论，每一步迭代中find()操作所需的时间线性正比于查找区间宽度，即当前节点的秩；由3.3.7节的分析结论，列表节点每次remove()操作仅需常数时间。因此，总体执行时间应为： 2 1 + 2 + 3 +... + n = n∙(n + 1) / 2 = O(n ) 相对于无序向量，尽管此处节点删除操作所需的时间减少，但总体渐进复杂度并无改进。 3.3.10 遍历列表也提供支持节点批量式访问（习题[3-5]）的遍历接口，其实现如代码3.15所示。 1 template void List::traverse(void (*visit)(T&)) //刟用函数指针机刢癿遍历 2 { for (ListNodePosi(T) p = header->succ; p != trailer; p = p->succ) visit(p->data); } 3 4 template template //元素类型、操作器 5 void List::traverse(VST& visit) //刟用函数对象机刢癿遍历 6 { for (ListNodePosi(T) p = header->succ; p != trailer; p = p->succ) visit(p->data); } 代码3.15 列表遍历接口traverse() 该接口的设计思路与实现方式，与向量的对应接口（2.5.8节）如出一辙，复杂度也相同。 §3.4 有序列表若列表中所有节点的逻辑次序与其大小次序完全一致，则称作有序列表（sorted list）。为保证节点之间可以定义次序，依然假定元素类型T直接支持大小比较，或已重载相关操作符。与有序向量一致地，这里依然约定采用非降次序。 3.4.1 唯一化与有序向量同理，有序列表中的雷同节点也必然（在逻辑上）彼此紧邻。利用这一特性，可实现重复节点删除算法如代码3.16所示。位置指针p和q分别指向每一对相邻的节点，若二者雷同则删除q，否则转向下一对相邻节点。如此反复迭代，直至检查过所有节点。 1 template int List::uniquify() { //成批剔除重复元素，效率更高 2 if (_size < 2) return 0; //平凡列表自然无重复 3 int oldSize = _size; //记弽原觃模 4 ListNodePosi(T) p; ListNodePosi(T) q; //依次指向紧邻癿各对节点 5 for (p = header, q = p->succ; trailer != q; p = q, q = q->succ) //从自左向右扫描 6 if (p->data == q->data) { remove(q); q = p; } //若p和q雷同，则初除后者 77 7 return oldSize - _size; //列表觃模发化量，即被初除元素总数 8 } 代码3.16 有序列表剔除重复节点接口uniquify() 整个过程的运行时间为O(_size) = O(n)，线性正比于列表原先的规模。 §3.5 排序器第3章列表 3.4.2 查找实现有序列表的节点查找算法，可实现如代码3.17所示。 1 template //在有序列表内节点p（可能是trailer）癿n个（真）前驱中，找刡丌大亍e癿最后者 2 ListNodePosi(T) List::search(T const& e, int n, ListNodePosi(T) p) const { 3 // assert: 0 succ; remove(p->pred); //转向下一节点 6 } 7 } 代码3.19 列表癿揑入排序按3.4.2节的约定，有多个元素命中时search()接口将返回其中最靠后者，排序之后重复元素将保持其原有次序，故以上插入排序算法属于稳定算法。复杂度插入排序算法共由n步迭代组成，故其运行时间应取决于，各步迭代中所执行的查找、删除及插入操作的效率。根据此前3.3.5节和3.3.7节的结论，插入操作insertAfter()和删除操作 remove()均只需O(1)时间；而由3.4.2节的结论，查找操作search()所需时间可在O(1)至O(n) 之间浮动（从如表3.3所示的实例，也可看出这一点）。不难验证，当输入序列已经有序时，该算法中的每次search()操作均仅需O(1)时间，总体运行时间为O(n)。但反过来，若输出序列完全逆序，则各次search()操作所需时间将线性递增， 2 2 累计共需O(n )时间。在等概率条件下，平均仍需要O(n )时间（习题[3-10]）。 3.5.3 选择排序选择排序（selectionsort）也适用于向量与列表之类的序列结构。构思与插入排序类似，该算法也将序列划分为无序前缀和有序后缀两部分；此外，还要求前缀不大于后后缀。如此，每次只需从前缀中选出最大者，并作为最小元素转移至后缀中，即可使有序部分的范围不断扩张。 80 图3.6 序列癿选择排序第3章列表 §3.5 排序器同样地，上述描述也给出了选择排序算法过程所具有的不变性：在任何时刻，后缀S[r, n)已经有序，且不小于前缀S[0, r) 在算法的初始时刻，后缀为空，不变性自然满足。如图3.6(a)所示，假设不变性已满足。于是，可调用无序序列的查找算法，从前缀中找出最大者M。接下来，只需将M从前缀中取出并作为首元素插入后缀，即可如图(b)所示，使得后缀的范围扩大，并继续保持有序。如此，该后缀的范围可不断拓展。当其最终覆盖整个序列时，亦即整体有序。实例表3.4 选择排序算法实例 #迭代前缀无序子序列后缀有序子序列 0 5 2 7 4 6 3 1_ ^ 1 5 2 4 6 3 1_ 7 2 5 2 4 3 1_ 6 7 3 2 4 3 1_ 5 6 7 4 2 3 1_ 4 5 6 7 5 2 1_ 3 4 5 6 7 6 1_ 2 3 4 5 6 7 7 ^_ 1 2 3 4 5 6 7 序列选择排序算法的一个实例如表3.4所示。其中，前后共经7步迭代，输入序列中的7个元素按由大到小的次序，依次被从无序前缀子序列中取出，并作为首元素插至初始为空的有序后缀序列中。无序子序列在各步迭代中的最大元素用方框注明。实现依照以上思路，可针对列表实现选择排序算法如代码3.20所示。 1 template //列表癿选择排序算法：对起始亍位置p癿n个元素排序 2 void List::selectionSort(ListNodePosi(T) p, int n) { //valid(p) && rank(p) + n pred; ListNodePosi(T) tail = p; 4 for (int i = 0; i < n; i++) tail = tail->succ; //待排序匙间为(head, tail) 5 while (1 < n) { //在至少迓剩两个节点乀前，在待排序匙间内 6 ListNodePosi(T) max = selectMax(head->succ, n); //找出最大者（歧丿时后者优先） 7 insertBefore(tail, remove(max)); //将其秱至无序匙间末尾（作为有序匙间新癿首元素） 81 8 tail = tail->pred; n--; 9 } 10 } 代码3.20 列表癿选择排序其中的selectMax()接口用于在无序列表中定位最大节点，其实现如代码3.21所示。 §3.5 排序器第3章列表 1 template //从起始亍位置p癿n个元素中选出最大者 2 ListNodePosi(T) List::selectMax(ListNodePosi(T) p, int n) { 3 ListNodePosi(T) max = p; //最大者暂定为首节点p 4 for (ListNodePosi(T) cur = p; 1 < n; n--) //从首节点p出収，将后续节点逐一不max比较 5 if (!lt((cur = cur->succ)->data, max->data)) //若弼前元素丌小亍max，则 6 max = cur; //更新最大元素位置记弽 7 return max; //迒回最大节点位置 8 } 代码3.21 列表最大节点癿定位复杂度与插入排序类似地，选择排序亦由n步迭代组成，故其运行时间取决于各步迭代中查找及插入操作的效率。根据3.3.5和3.3.7节的结论，insertBefore()和remove()均只需O(1)时间。 2 selectMax()每次必须遍历整个无序前缀，耗时应线性正比于前缀长度；全程累计耗时O(n ）。实际上进一步地仔细观察之后不难发现，无论输入序列中各元素的大小次序如何，以上n次 2 selectMax()调用的累计耗时总是(n ）。因此与插入排序算法不同，以上选择排序算法的时 2 间复杂度为固定的(n )。也就是说，其最好和最坏情况下的渐进效率相同。 2 选择排序属于CBA式算法，故相对于2.7.5节所给出的(nlogn)下界，(n )的效率应有很大的改进空间。正如我们将在 10.2.5节看到的，借助更为高级的数据结构，可以令单次 selectMax()操作的复杂度降至O(logn)，从而使选择排序的整体效率提高至O(nlogn)。 3.5.4 归并排序 2.8.3节介绍过基于二路归并的向量排序算法，其构思也同样适用于列表结构。实际上，有序列表的二路归并不仅可以实现，而且能够达到与有序向量二路归并同样高的效率。二路归并算法的实现代码3.22针对有序列表结构，给出了二路归并算法的一种实现。 1 template //有序列表癿弻幵：弼前列表中自p起癿n个元素，不列表L中自q起癿m个元素弻幵 2 void List::merge(ListNodePosi(T)& p, int n, List& L, ListNodePosi(T) q, int m) { 3 // assert: this.valid(p) && rank(p) + n data data)) //若p仍在匙间内且v(p) succ)) break; n--; } //将p替换为其直接后继（等效亍将p弻入合幵癿列表） 10 else //若p已超出右界戒v(q) < v(p)，则 11 { insertBefore(p, L.remove((q = q->succ)->pred)); m--; } //将q转秱至p乀前 12 p = pp->succ; //确定弻幵后匙间癿（新）起点 13 } 代码3.22 有序列表癿事路归幵第3章列表 §3.5 排序器作为有序列表的内部接口，List::merge()可以将另一有序列表L中起始于节点q、长度为m 的子列表，与当前有序列表中起始于节点p、长度为n的子列表做二路归并。为便于递归地实现上层的归并排序，在二路归并的这一版本中，归并所得的有序列表依然起始于节点p。在更为通用的场合，不见得需要采用这一约定。归并时间代码3.22中二路归并算法merge()的时间成本主要消耗于其中的迭代。该迭代反复地比较两个子列表的首节点p和q，并视其大小相应地令p指向其后继，或将节点q取出并作为p的前驱插入前一子列表。当且仅当后一子列表中所有节点均处理完毕时，迭代才会终止。因此，在最好情况下，共需迭代m次；而在最坏情况下，则需迭代n次。总体而言，共需O(n + m)时间，线性正比于两个子列表的长度之和。特例在List模板类（70页代码3.2）中，作为以上二路归并通用接口的一个特例，还重载并开放了另一个接口List::merge(L)，用以将有序列表L完整地归并到当前有序列表中。请注意，以上二路归并算法的通用接口，对列表L没有过多的限定，因此同样作为一个特例，该算法也适用于L同为当前列表的情形。此时，待归并的列表实际上是来自同一列表的两个子列表（当然，此时的两个子列表不得相互重叠。也就是说，在两个首节点中，p应是q的前驱，且二者的间距不得小于n）。对以下归并排序算法的简捷实现而言，这一特性至关重要。分治策略仿照向量的归并排序算法mergesort()（62页代码2.28），采用分治策略并基于以上有序列表的二路归并算法，可如代码3.23所示，递归地描述和实现列表的归并排序算法。 1 template //列表癿弻幵排序算法：对起始亍位置p癿n个元素排序 2 void List::mergeSort(ListNodePosi(T)& p, int n) { //valid(p) && rank(p) + n > 1; //以中点为界 5 ListNodePosi(T) q = p; for (int i = 0; i < m; i++) q = q->succ; //均分列表 6 mergeSort(p, m); mergeSort(q, n - m); //对前、后子列表分删排序 7 merge(p, m, *this, q, n - m); //弻幵 8 } //注意：排序后，p依然指向弻幵后匙间癿（新）起点代码3.23 列表癿归幵排序排序时间根据该算法的流程，为对长度为n的列表做归并排序，首先需要花费线性时间确定居中的切分节点，然后递归地对长度均为n/2的两个子列表做归并排序，最后还需花费线性的时间做二路归并。因此，仿照2.8.3节对向量归并排序算法的分析方法，同样可知其复杂度应为O(nlogn)。 83 另外，以上列表归并排序算法的递归跟踪过程，与如图2.19所示的向量版本别无二致。故从递归跟踪的角度，亦可得出同样的结论。请注意，在子序列的划分阶段，向量与列表归并排序算法之间存在细微但本质的区别。前者支持循秩访问的方式，故可在O(1)时间内确定切分中点；后者仅支持循位置访问的方式，故不得不为此花费O(n)时间。幸好在有序子序列的合并阶段二者均需O(n)时间，故二者的渐进时间 §3.5 排序器第3章列表复杂度依然相等。最后，尽管二路归并算法并未对子列表的长度做出任何限制，但这里出于整体效率的考虑，在划分子列表时宁可花费O(n)时间使得二者尽可能接近于等长。反之，若为省略这部分时间而不保证划分的均衡性，则反而可能导致整体效率的下降（习题[3-16]）。 84

数据结构_ C++语言版第三版 PDF - 邓俊辉

Document Details

Tags

Related

Summary

Full Transcript

数据结构_ C++语言版 第三版 PDF - 邓俊辉

Document Details

Tags

Related

Summary

Full Transcript

数据结构_ C++语言版第三版 PDF - 邓俊辉