树与树的算法的实现 ------ Python数据结构与算法第8章

1. 树的概念

树(tree)是一种抽象数据类型(ADT)或是作这种抽象数据类型的数据结构,用来模拟具有树状结构性质的数据集合。 它是由n(n>=1)个有限节点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。它具有以下的特点:

① 每个节点有零个或多个子节点
② 没有父节点的节点称为根节点
③ 每一个非根节点有且只有一个父节点
④ 除了根节点外,每个子节点可以分为多个不相交的子树

2. 树的术语
  • 节点的度:一个节点含有子树的个数称为该节点的度
  • 树的度:一棵树中,最大的节点的度称为树的度
  • 叶子节点或终端节点:度为零的节点
  • 父亲节点或父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点
  • 孩子节点或子节点:一个节点含有的子树的根节点称为该节点的子节点
  • 兄弟节点:具有相同父节点的节点互称为兄弟节点
  • 节点的层次:从根开始定义起,根为第1层,根的子节点为第2层,以此类推
  • 树的高度或深度:树中节点的最大层次
  • 堂兄弟节点:父节点在同一层的节点互为堂兄弟
  • 节点的祖先:从根到该节点所经分支上的所有节点
  • 子孙:以某节点为根的子树中任一节点都称为该节点的子孙
  • 森林:由m(m>=0)棵互不相交的树的集合称为森林
3. 树的种类

树分为无序树和有序树,树中任意节点的子节点之间没有顺序关系,这种树称为无序树,也称为自由树。树中任意节点的子节点之间有顺序关系,这种树称为有序树。有序树还可以进一步划分:

① 二叉树:每个节点最多含有 两个 子树的树称为二叉树

② 完全二叉树:对于一颗二叉树,假设其深度为d(d>1)。除了第d层外,其它各层的节点数目均已达最大值,且第d层所有节点从左向右连续地紧密排列,这样的二叉树被称为完全二叉树。其中满二叉树的定义是所有叶子节点都在最底层的完全二叉树

③ 平衡二叉树:当且仅当任何节点的两棵子树的 高度差不大于1的二叉树

④ 排序二叉树:也称二叉搜索树、有序二叉树

⑤ 霍夫曼树:带权路径最短 的二叉树称为哈夫曼树或最优二叉树,用于信息编码

⑥ B树:一种对 读写操作进行优化的自平衡的二叉查找树,能够保持数据有序,拥有多于两个子树

4. 树的存储与表示

顺序存储:
在这里插入图片描述

将数据结构存储在固定的数组中,在 遍历速度上有一定的优势,但因 所占空间比较大,是非主流二叉树。二叉树通常以链式存储

链式存储:
在这里插入图片描述
由于对节点的个数无法掌握,常见树的存储表示都转换成二叉树进行处理,子节点个数最多为2。

5. 树的应用场景

① xml、html等,那么编写这些格式文件的解析器不可避免用到树
② 路由协议
③ mysql数据库索引
④ 文件系统的目录结构
⑤ 很多经典的 AI算法其实都是树搜索,此外机器学习中的决策树也是树结构

6. 二叉树的基本概念

二叉树是每个节点最多有两个子树的树结构。通常子树被称作“左子树”(left subtree)和“右子树”(right subtree)。

7. 二叉树的性质

性质1: 在二叉树的第i层上至多有 2(i-1) 个结点(i>0)

性质2: 深度为k的二叉树至多有 2k - 1 个结点(k>0)

性质3: 对于任意一棵二叉树,如果其叶结点数为N0,而度数为2的结点总数为N2,则N0=N2+1

性质4:具有n个结点的完全二叉树的深度必为 log2(n+1)

性质5:对完全二叉树,若从上至下、从左至右编号,则编号为i的结点,其左孩子编号必为2i,其右孩子编号必为2i+1;其双亲的编号必为i/2(i=1 时为根,除外)

完全二叉树:如果设二叉树的深度是h,除了h层以外,其它各层的节点数都达到了最大数。第h层有叶子节点,并且叶子节点都是从左到右依次排布
在这里插入图片描述
满二叉树:除了叶子结点外每一个结点都有左右子叶且叶子结点都处在最底层的二叉树
在这里插入图片描述

8. 二叉树的节点表示以及树的创建

Node类中定义三个属性,分别是节点本身的值,还有左孩子和右孩子:

class Node:
    def __init__(self, elem, l_child=None, r_child=None):
        self.elem = elem  # 节点本身的值
        self.l_child = l_child  # 左孩子
        self.r_child = r_child  # 右孩子

树的创建,创建一个树的类,并给一个根节点,一开始为空,随后添加节点:

class Node:
    def __init__(self, elem, l_child=None, r_child=None):
        self.elem = elem  # 节点本身的值
        self.l_child = l_child  # 左孩子
        self.r_child = r_child  # 右孩子

class Tree:
    def __init__(self, root=None):
        self.root = root

    def add_node(self, elem):
        # 创建一个节点
        node = Node(elem)
        # 如果根节点为空,则为根节点赋值
        if self.root == None:
            self.root = node
        # 否则继续判断
        else:
            # 创建一个队列并加入根节点
            queue = [self.root]
            while queue:
                # 弹出第一个节点
                curr_node = queue.pop(0)
                # 如果该节点的左孩子为空,则需要创建的节点赋给当前节点的左孩子节点
                if curr_node.l_child is None:
                    curr_node.l_child = node
                    return
                # 如果该节点的右孩子为空,则需要创建的节点赋给当前节点的右孩子节点
                elif curr_node.r_child is None:
                    curr_node.r_child = node
                    return
                # 如果该节点的左孩子和右孩子都有值,则需要将左右孩子加入队列继续判断它们有没有孩子节点
                else:
                    queue.append(curr_node.l_child)
                    queue.append(curr_node.r_child)
                    
tree = Tree()
# 第一个赋值给根节点
tree.add_node('A')
# 为根节点的左孩子赋值
tree.add_node('B')
# 为根节点的右孩子赋值
tree.add_node('C')
# 为根节点的左孩子的左孩子赋值
tree.add_node('D')
# 为根节点的左孩子的右孩子赋值
tree.add_node('E')
# 为根节点的右孩子的左孩子赋值
tree.add_node('F')
# 为根节点的右孩子的右孩子赋值
tree.add_node('G')
9. 二叉树的遍历

树的遍历是树的一种重要的运算。所谓遍历是指对树中所有结点的信息的访问,即依次对树中每个结点访问一次且仅访问一次,我们把这种对所有节点的访问称为遍历(traversal)。那么树的两种重要的遍历模式是深度优先遍历和广度优先遍历,深度优先一般用递归,广度优先一般用队列。一般情况下能用递归实现的算法大部分也能用堆栈来实现。

10. 二叉树广度优先遍历

广度优先遍历也就是层次遍历,从树的根节点开始,从上到下从从左到右遍历整个树的节点:

class Node:
    def __init__(self, elem, l_child=None, r_child=None):
        self.elem = elem  # 节点本身的值
        self.l_child = l_child  # 左孩子
        self.r_child = r_child  # 右孩子

class Tree:
    def __init__(self, root=None):
        self.root = root

    def add_node(self, elem):
        # 创建一个节点
        node = Node(elem)
        # 如果根节点为空,则为根节点赋值
        if self.root == None:
            self.root = node
        # 否则继续判断
        else:
            # 创建一个队列并加入根节点
            queue = [self.root]
            while queue:
                # 弹出第一个节点
                curr_node = queue.pop(0)
                # 如果该节点的左孩子为空,则需要创建的节点赋给当前节点的左孩子节点
                if curr_node.l_child is None:
                    curr_node.l_child = node
                    return
                # 如果该节点的右孩子为空,则需要创建的节点赋给当前节点的右孩子节点
                elif curr_node.r_child is None:
                    curr_node.r_child = node
                    return
                # 如果该节点的左孩子和右孩子都有值,则需要将左右孩子加入队列继续判断它们有没有孩子节点
                else:
                    queue.append(curr_node.l_child)
                    queue.append(curr_node.r_child)

    def breadth_traversal(self):
        if self.root is None:
            return
        queue = [self.root]
        while queue:
            curr_node = queue.pop(0)
            print(curr_node.elem)
            if curr_node.l_child is not None:
                queue.append(curr_node.l_child)
            if curr_node.r_child is not None:
                queue.append(curr_node.r_child)

tree = Tree()
# 第一个赋值给根节点
tree.add_node('A')
# 为根节点的左孩子赋值
tree.add_node('B')
# 为根节点的右孩子赋值
tree.add_node('C')
# 为根节点的左孩子的左孩子赋值
tree.add_node('D')
# 为根节点的左孩子的右孩子赋值
tree.add_node('E')
# 为根节点的右孩子的左孩子赋值
tree.add_node('F')
# 为根节点的右孩子的右孩子赋值
tree.add_node('G')
tree.breadth_traversal()
"""
A
B
C
D
E
F
G
"""
11. 二叉树深度优先遍历

对于一颗二叉树,深度优先搜索(Depth First Search)是沿着树的深度遍历树的节点,尽可能深的搜索树的分支。那么深度遍历有重要的三种方法。这三种方式常被用于访问树的节点,它们之间的不同在于访问每个节点的次序不同。这三种遍历分别叫做先序遍历(preorder),中序遍历(inorder)和后序遍历(postorder)。

① 先序遍历。在先序遍历中,我们先访问根节点,然后递归使用先序遍历访问左子树,再递归使用先序遍历访问右子树。遍历的顺序是:根节点->左子树->右子树

def preorder_traversal(self, root):
    """递归实现先序遍历"""
    if root is None:
        return
    print(root.elem, end=' ')
    self.preorder_traversal(root.l_child)
    self.preorder_traversal(root.r_child)

② 中序遍历。在中序遍历中,我们递归使用中序遍历访问左子树,然后访问根节点,最后再递归使用中序遍历访问右子树。遍历的顺序是:左子树->根节点->右子树

def inorder_traversal(self, root):
    """递归实现中序遍历"""
    if root is None:
        return
    self.inorder_traversal(root.l_child)
    print(root.elem, end=' ')
    self.inorder_traversal(root.r_child)

③ 后序遍历。在后序遍历中,我们先递归使用后序遍历访问左子树和右子树,最后访问根节点。遍历的顺序是:左子树->右子树->根节点

def postorder_traversal(self, root):
    """递归实现后续遍历"""
    if root is None:
        return
    self.postorder_traversal(root.l_child)
    self.postorder_traversal(root.r_child)
    print(root.elem, end=' ')

完整的遍历测试:

class Node:
    def __init__(self, elem, l_child=None, r_child=None):
        self.elem = elem  # 节点本身的值
        self.l_child = l_child  # 左孩子
        self.r_child = r_child  # 右孩子

class Tree:
    def __init__(self, root=None):
        self.root = root

    def add_node(self, elem):
        # 创建一个节点
        node = Node(elem)
        # 如果根节点为空,则为根节点赋值
        if self.root == None:
            self.root = node
        # 否则继续判断
        else:
            # 创建一个队列并加入根节点
            queue = [self.root]
            while queue:
                # 弹出第一个节点
                curr_node = queue.pop(0)
                # 如果该节点的左孩子为空,则需要创建的节点赋给当前节点的左孩子节点
                if curr_node.l_child is None:
                    curr_node.l_child = node
                    return
                # 如果该节点的右孩子为空,则需要创建的节点赋给当前节点的右孩子节点
                elif curr_node.r_child is None:
                    curr_node.r_child = node
                    return
                # 如果该节点的左孩子和右孩子都有值,则需要将左右孩子加入队列继续判断它们有没有孩子节点
                else:
                    queue.append(curr_node.l_child)
                    queue.append(curr_node.r_child)

    def breadth_traversal(self):
        """广度优先遍历/层次遍历"""
        if self.root is None:
            return
        queue = [self.root]
        while queue:
            curr_node = queue.pop(0)
            print(curr_node.elem, end=' ')
            if curr_node.l_child is not None:
                queue.append(curr_node.l_child)
            if curr_node.r_child is not None:
                queue.append(curr_node.r_child)

    def preorder_traversal(self, root):
        """递归实现先序遍历"""
        if root is None:
            return
        print(root.elem, end=' ')
        self.preorder_traversal(root.l_child)
        self.preorder_traversal(root.r_child)

    def inorder_traversal(self, root):
        """递归实现中序遍历"""
        if root is None:
            return
        self.inorder_traversal(root.l_child)
        print(root.elem, end=' ')
        self.inorder_traversal(root.r_child)

    def postorder_traversal(self, root):
        """递归实现后续遍历"""
        if root is None:
            return
        self.postorder_traversal(root.l_child)
        self.postorder_traversal(root.r_child)
        print(root.elem, end=' ')

tree = Tree()
# 第一个赋值给根节点
tree.add_node(0)
# 为根节点的左孩子赋值
tree.add_node(1)
# 为根节点的右孩子赋值
tree.add_node(2)
# 为根节点的左孩子的左孩子赋值
tree.add_node(3)
# 为根节点的左孩子的右孩子赋值
tree.add_node(4)
# 为根节点的右孩子的左孩子赋值
tree.add_node(5)
# 为根节点的右孩子的右孩子赋值
tree.add_node(6)
tree.add_node(7)
tree.add_node(8)
tree.add_node(9)
print('广度优先遍历(层次遍历):', end='')
tree.breadth_traversal()
print('\n前序遍历:', end='')
tree.preorder_traversal(tree.root)
print('\n中序遍历:', end='')
tree.inorder_traversal(tree.root)
print('\n后序遍历:', end='')
tree.postorder_traversal(tree.root)
"""
广度优先遍历(层次遍历):0 1 2 3 4 5 6 7 8 9 
前序遍历:0 1 3 7 8 4 9 2 5 6 
中序遍历:7 3 8 1 9 4 0 5 2 6 
后序遍历:7 8 3 9 4 1 5 6 2 0 
"""

Github:https://github.com/ThanlonSmith/Data-Structure-Python3

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章