二叉搜索树 - 52coder

二叉查找树（英语：Binary Search Tree），也称二叉搜索树、有序二叉树（英语：ordered binary tree），排序二叉树（英语：sorted binary tree），是指一棵空树或者具有下列性质的二叉树：
若任意节点的左子树不空，则左子树上所有节点的值均小于它的根节点的值；
若任意节点的右子树不空，则右子树上所有节点的值均大于它的根节点的值；
任意节点的左、右子树也分别为二叉查找树；
没有键值相等的节点。

二叉查找树相比于其他数据结构的优势在于查找、插入的时间复杂度较低。为O(log n)。二叉查找树是基础性数据结构，用于构建更为抽象的数据结构，如集合、multiset、关联数组等。

二叉查找树的查找过程和次优二叉树类似，通常采取二叉链表作为二叉查找树的存储结构。中序遍历二叉查找树可得到一个关键字的有序序列，一个无序序列可以通过构造一棵二叉查找树变成一个有序序列，构造树的过程即为对无序序列进行查找的过程。每次插入的新的结点都是二叉查找树上新的叶子结点，在进行插入操作时，不必移动其它结点，只需改动某个结点的指针，由空变为非空即可。搜索、插入、删除的复杂度等于树高，期望O(log n)，最坏 O(n)（数列有序，树退化成线性表）。

虽然二叉查找树的最坏效率是O(n),但它支持动态查询，且有很多改进版的二叉查找树可以使树高为O(log n) ,如SBT,AVL树，红黑树等。故不失为一种好的动态查找方法。

二叉搜索树的查找算法

在二叉搜索树b中查找x的过程为：

1.若b是空树，则搜索失败，否则：
2.若x等于b的根节点的数据域之值，则查找成功；否则：
3.若x小于b的根节点的数据域之值，则搜索左子树；否则：
4.查找右子树。

/* 以下代码为C++写成，下同*/
Status SearchBST(BiTree T, KeyType key, BiTree f, BiTree &p){
  //在根指针T所指二元查找樹中递归地查找其關键字等於key的數據元素，若查找成功，
  //則指针p指向該數據元素節點，并返回TRUE，否則指针指向查找路徑上訪問的最後
  //一個節點并返回FALSE，指针f指向T的雙親，其初始调用值為NULL
  if(!T) { //查找不成功
    p=f;
    return false;
  }
  else if (key == T->data.key) { //查找成功
    p=T;
    return true;
  }
  else if (key < T->data.key) //在左子樹中繼續查找
    return SearchBST(T->lchild, key, T, p);
  else //在右子樹中繼續查找
    return SearchBST(T->rchild, key, T, p);
}

在二叉搜索树插入节点的算法

向一个二叉搜索树b中插入一个节点s的算法，过程为：

若b是空树，则将s所指结点作为根节点插入，否则：
1.若s->data等于b的根节点的数据域之值，则返回，否则：
2.若s->data小于b的根节点的数据域之值，则把s所指节点插入到左子树中，否则：
3.把s所指节点插入到右子树中。（新插入节点总是叶子节点）

/*当二元搜尋樹T中不存在关键字等于e.key的数据元素时，插入e并返回TRUE，否则返回FALSE*/
Status InsertBST(BiTree *T, ElemType e){  
      if(!T)  
        {       
            s = new BiTNode;
            s->data = e; s->lchild = s->rchild = NULL;
            T=s;    //被插節点*s为新的根结点
        }
      else if(e.key == T->data.key)
        return false;//关键字等于e.key的数据元素，返回錯誤
      if (e.key < T->data.key)
    InsertBST(T->lchild, e);    //將e插入左子樹
      else 
    InsertBST(T->rchild, e);    //將e插入右子樹
      return true;
 }

在二叉查找树删除结点的算法

在二叉查找树删去一个结点，分三种情况讨论：

若*p结点为叶子结点，即PL（左子树）和PR（右子树）均为空树。由于删去叶子结点不破坏整棵树的结构，则只需修改其双亲结点的指针即可。
若*p结点只有左子树PL或右子树PR，此时只要令PL或PR直接成为其双亲结点*f的左子树（当*p是左子树）或右子树（当*p是右子树）即可，作此修改也不破坏二叉查找树的特性。
若*p结点的左子树和右子树均不空。在删去*p之后，为保持其它元素之间的相对位置不变，可按中序遍历保持有序进行调整，可以有两种做法：其一是令*p的左子树为*f的左/右（依*p是*f的左子树还是右子树而定）子树，*s为*p左子树的最右下的结点，而*p的右子树为*s的右子树；其二是令*p的直接前驱（in-order predecessor）或直接后继（in-order successor）替代*p，然后再从二叉查找树中删去它的直接前驱（或直接后继）。

Status DeleteBST(BiTree *T, KeyType key){
  //若二叉查找树T中存在关键字等于key的数据元素时，则删除该数据元素，并返回
  //TRUE；否则返回FALSE
  if(!T) 
    return false;   //不存在关键字等于key的数据元素
  else{
    if(key == T->data.key) {    //  找到关键字等于key的数据元素
      return Delete(T);
    }
    else if(key < T->data.key)
      return DeleteBST(T->lchild, key);
    else
      return DeleteBST(T->rchild, key);
  }
}

Status Delete(BiTree *&p){
  //该节点为叶子节点，直接删除
  BiTree *q, *s;
  if (!p->rchild && !p->lchild)
  {
      delete p;
      p = NULL;  // Status Delete(BiTree *&p) 要加&才能使P指向NULL
  }
  else if(!p->rchild){  //右子树空则只需重接它的左子树
    q=p->lchild;
    p->data = p->lchild->data;
    p->lchild=p->lchild->lchild;
    p->rchild=p->lchild->rchild;

    delete q;
  }
  else if(!p->lchild){  //左子树空只需重接它的右子树
    q=p->rchild;
    p->data = p->rchild->data;
    p->lchild=p->rchild->lchild;
    p->rchild=p->rchild->rchild;

    delete q;  }
  else{ //左右子树均不空
    q=p; 
    s=p->lchild;
    while(s->rchild){ 
      q=s; 
      s=s->rchild;
    }   //转左，然后向右到尽头
    p->data = s->data;  //s指向被删结点的“前驱”
    if(q!=p)    
      q->rchild = s->lchild;    //重接*q的右子树
    else 
      q->lchild = s->lchild;    //重接*q的左子树
    delete s;
  }
  return true;
}

上面代码左右子树均不空的情形中通过判断q与p是否相等，实现非常巧妙。
开始q等于p，如果while循环不成立则最后要更改q->lchild。
在C语言中有些编译器不支持为struct Node 节点分配空间，声称这是一个不完全的结构，可使用一个指向该Node的指针为之分配空间。

如：sizeof( Probe )，Probe作为二叉树节点在typedef中定义的指针。

二叉查找树性能分析

最坏情况下，当先后插入的关键字有序时，构成的二叉查找树蜕变为单支树，树的深度为n，其平均查找长度为(n+1)/2（和顺序查找相同），最好的情况是二叉查找树的形态和折半查找的判定树相同，其平均查找长度和logn(以2为底)成正比。