数据结构 知识点梳理汇总.docx
第一章数据结构概述基本概念与术语1 .数据:数据是对客观事物的符号表示,在计算机科学中是指所有能输入到计算机中并被计算机程序所处理的符号的总称。2 .数据元素:数据元素是数据的基本单位,是数据这个集合中的个体,也称之为元素,结点,顶点记录。(补充:一个数据元素可由若干个数据项组成。数据项是数据的不可分割的最小单位。)3 .数据对象:数据对象是具有相同性质的数据元素的集合,是数据的一个子集。(有时候也叫做属性。)4 .数据结构:数据结构是相互之间存在一种或多种特定关系的数据元素的集合。(1)数据的逻辑结构:数据的逻辑结构是指数据元素之间存在的固有逻辑关系,常称为数据结构。数据的逻辑结构是从数据元素之间存在的逻辑关系上描述数据与数据的存储无关,是独立于计算机的。依据数据元素之间的关系,可以把数据的逻辑结构分成以下几种:1 .集合:数据中的数据元素之间除了“同属于一个集合”的关系以外,没有其他关系。2 .线性结构:结构中的数据元素之间存在“一对一”的关系。若结构为非空集合,则除了第一个元素之外,和最后一个元素之外,其他每个元素都只有一个直接前驱和一个直接后继。3 .树形结构:结构中的数据元素之间存在“一对多”的关系。若数据为非空集,则除了第一个元素(根)之外,其它每个数据元素都只有一个直接前驱,以及多个或零个直接后继。4 .图状结构:结构中的数据元素存在“多对多”的关系。若结构为非空集,折每个数据可有多个(或零个)直接后继。(2)数据的存储结构:数据元素及其关系在计算机内的表示称为数据的存储结构。想要计算机处理数据,就必须把数据的逻辑结构映射为数据的存储结构。逻辑结构可以映射为以下两种存储结构:1 .顺序存储结构:把逻辑上相邻的数据元素存储在物理位置也相邻的存储单元中,借助元素在存储器中的相对位置来表示数据之间的逻辑关系。2 .链式存储结构:借助指针表达数据元素之间的逻辑关系。不要求逻辑上相邻的数据元素物理位置上也相邻。5.时间复杂度分析:1.常量阶:算法的时间复杂度与问题规模n无关系T(n)=O2 .线性阶:算法的时间复杂度与问题规模n成线性关系T(n)=O(n)3 .平方阶和立方阶:一般为循环的嵌套,循环体最后条件为i+时间复杂度的大小比较:0(l)<O(log2n)<0(n)<0(nlog2n)<0(n2)<0(n3)<0(2n)<O(n!)<O(nn)6.算法与程序:(1)算法的5个特性1、输入:有零个或多个输入2、输出:有一个或多个输出3、有穷性:要求序列中的指令是有限的;每条指令的执行包含有限的工作量;整个指令序列的执行在有限的时间内结束。(程序与算法的区别在于,程序不需要有有穷性)4、确定性:算法中的每一个步骤都必须是确定的,而不应当含糊、模棱两可。没有歧义。5、可行性:算法中的每一个步骤都应当能被有效的执行,并得到确定的结果。(2),算法设计的要求:1、正确性(达到预期效果,满足问题需求)2、健壮性(能处理合法数据,也能对不合法的数据作出反应,不会产生不可预期的后果)3、可读性(要求算法易于理解,便于分析)4、可修改可扩展性5、高效率(较好的时空性能)补充内容:1、名词解释:数据结构、二元组数据结构就是相互之间存在一种或多种特定关系的数据元素的集合。二元组就是一种用来表示某个数据对象以及各个元素之间关系的有限集合。2、根据数据元素之间关系的不同,数据的逻辑结构可以分为集合、线性结构、树形结构和图状结构四种类型。3、常见的数据存储结构一般有两种类型,它们分别是顺序存储结构、链式存储结构6 .在一般情况下,一个算法的时间复杂度是问题规模的函数7 .常见时间复杂度有:常数阶O(1)、线性阶O(n)对数阶O(log2n)、平方阶0(22)、指数阶0(2八n)。通常认为,具有常数阶量级的算法是好算法,而具有指数阶量级的算法是差算法。第二章线性表定义:线性表是n个数据元素的有限序列。一个数据元素可由若干个数据项组成。1 .顺序表结构线性表的顺序存储是指在内存中用地址连续的一块存储空间顺序存放线性表的各元素,用这种存储形式存储的线性表称为顺序表。2 .单链表(1)链表结点结构线性表中的数据元素可以用任意的一组存储单元来存储,用指针表示逻辑关系逻辑相邻的两元素的存储空间可以是不连续的。(2)链表操作算法:初始化、插入、输出、删除、遍历初始化:p=(structstudent*)malloc(sizeof(structstudent);插入:p->next=head->next;head->next=p;输出:printf(u%d,p->data);册IJ除:q=p->next;p->next=q->next;free(q);结点遍历:for(p=head;p;p=p->next);补充内容:1、线性表中,第一个元素没有直接前驱,最后一个元素没有直接后驱。2、在一个单链表中,若P所指结点是q所指结点的前驱结点,则删除结点q的操作语句为P->next=q->next;free(q);3、在长度为N的顺序表中,插入一个新元素平均需要移动表中N/2个元素,删除一个元素平均需要移动(NJ)/2个元素。4、若线性表的主要操作是在最后一个元素之后插入一个元素或删除最后一个元素,则采用顺序表存储结构最节省运算时间。5、已知顺序表中每个元素占用3个存储单元,第13个元素的存储地址为336,则顺序表的首地址为300o(第n个元素的地址即首地址+(nl)*每个元素的存储空间,如a12(第13个元素)的地址=a0+12*3)6、设有一带头结点单链表L,请编写该单链表的初始化,插入、输出和删除函数。(函数名自定义)结点定义:typedefintdatatype;结点数据类型,假设为inttypedefstructnode结点结构datatypedata;structnode*next;双向链表还应加上*previousLnode,*Pointer;/结点类型,结点指针类型typedefPOinteMklist;单链表类型,即头指针类型1 .初始化:Iklistinitlist()pointerhead;head=newnode;这是C+做法/head=(pointer)malloc(sizeof(Lnode);这是C语言做法head->next=NULL;循环链表则是head->next=head;双向链表应加上head->previos=NULL;returnhead;)2 .插入:(C语言中需要把head转化为全局变量才能实现此程序)intinsert(lklisthead,datatypex,inti)pointerq,s;q=get(head,il);/找第i-1个点if(q=NULL)无第i-1点,即i<l或i>n+l时(COUt<<”非法插入位置!n”;这是C+做法,即C语言中的Printfr非法插入位置!n");returnO;s=new node;/生成新结点即C语言中的s=(pointer)malloc(sizeof(Lnode);s->data=x;s->next=q->next;新点的后继是原第i个点q->next=s;原第il个点的后继是新点return1;插入成功)3 .删除:(C语言中需要把head转化为全局变量才能实现此程序)intdelete(lklisthead,inti)pointerp,q;q=get(head,i-l);/找待删点的直接前趋if(q=NULLHq->next=NULL)即i<l或i>n时cout<<,非法删除位置!n";retum0;p=q->next;保存待删点地址q->next=p->next;修改前趋的后继指针deletep;释放结点即C语言中的free(p);return1;删除成1 .不带头结点的单链表head为空的判定条件是(八)A.head=NULLB.head->next=NULLC.head->next=headD.head!=NULL2 .带头结点的单链表head为空的判定条件是(B)A.head=NULLB.head->next=NULLC.head->next=headD.head!=NULL3 .在一个单链表中,若P所指结点不是最后结点,在P之后插入S所指结点,则执行(B)A.s->next=p;p->next=s;B.s->next=p->next;p->next=s;C.s->next=p->next;p=s;D.p->next=s;s->next=p;4.在一个单链表中,若删除P所指结点的后续结点,则执行(八)A. p->next=p->next->next;B. p=p->next;p->next=p->next->next;C. p->next=p->nextD. p=p->next->next5 .从一个具有n个结点的有序单链表中查找其值等于X结点时,在查找成功的情况下,需平均比较(B)个结点。A.nB.n/2C.(n-l)2D.0(nlog2n)6 .给定有n个元素的向量,建立一个有序单链表的时间复杂度(B)A.O(1)B.O(n)C.O(n2)D.O(nlog2n)7 .在一个具有n个结点的有序单链表中插入一个新结点并仍然有序的时间复杂度是(B)A.0(1)B.O(n)C.O(n2)D.O(nlog2n)8 .在一个单链表中删除q所指结点时,应执行如下操作:q=p->next;p->next=(p->next->next);free(q);这种题目靠一根指针是没有办法完成的,必须要借助第二根指针。9 .在一个单链表中P所指结点之后插入一个S所指结点时,应执行:s->next=(p->next)p->next=(s)操作。10 .对于一个具有n个节点的单链表,在已知所指结点后插入一个新结点的时间复杂度是(O(1);在给定值为X的结点后插入一个新结点的时间复杂度是(O(n)。11 .问答题线性表可用顺序表或链表存储。试问:(1)两种存储表示各有哪些主要优缺点?顺序表的存储效率高,存取速度快。但它的空间大小一经定义,在程序整个运行期间不会发生改变,因此,不易扩充。同时,由于在插入或删除时,为保持原有次序,平均需要移动一半(或近一半)元素,修改效率不高。链接存储表示的存储空间一般在程序的运行过程中动态分配和释放,且只要存储器中还有空间,就不会产生存储溢出的问题。同时在插入和删除时不需要保持数据元素原来的物理顺序,只需要保持原来的逻辑顺序,因此不必移动数据,只需修改它们的链接指针,修改效率较高。但存取表中的数据元素时,只能循链顺序访问,因此存取效率不高。(2)若表的总数基本稳定,且很少进行插入和删除,但要求以最快的速度存取表中的元素,这时,应采用哪种存储表示?为什么?应采用顺序存储表示。因为顺序存储表示的存取速度快,但修改效率低。若表的总数基本稳定,且很少进行插入和删除,但要求以最快的速度存取表中的元素,这时采用顺序存储表示较好。第三章栈和队列1.栈(1)栈的结构与定义定义:限定仅在表尾进行插入或删除操作的线性表。结构:typedefstructlistintlistsize;栈的容量structlist*head;/栈顶