树是一种抽象数据类型(ADT)或是视作这种抽象数据类型的数据结构,用来模拟具有树状结构性质的数据集合,他是由n(n>1)个有限节点组成一个具有层次结构的集合。把它叫做树是因为它看起来像一颗倒挂的树,也就是说它是根朝上,而叶朝下的。
由n(n>0)个元素组成的有限集合,其中:
每个元素称为结点(node);
有一个特定的结点,称为根结点或根(root);
除根结点外,其余结点被分成m(m>=0)个互不相交的有限集合,而每个子集又都是一棵树(称为原树的子树)
树的特性:- 每个节点有零个或多个子节点
- 没有父节点的节点称为根节点
- 每一个非根节点有且只有一个父节点
- 除了根节点外,每个子节点可以分为多个不相交的子树
节点的度:一个节点含有的子树的个数称为该节点的度;
树的度:一棵树中,最大的节点的度称为树的度;
树的高度或深度:树中节点的最大层次;
叶节点或终端节点:度为零的节点;
父亲节点或父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点;
孩子节点或子节点:一个节点含有的子树的根节点称为该节点的子节点;
兄弟节点:具有相同父节点的节点互称为兄弟节点;
节点的层次:从根开始定义起,根为第1层,根的子节点为第2层,以此类推;
堂兄弟节点:父节点在同一层的节点互为堂兄弟;
节点的祖先:从根到该节点所经分支上的所有节点;
子孙:以某节点为根的子树中任一节点都称为该节点的子孙。
森林:由m(m>=0)棵互不相交的树的集合称为森林;
常见的树分类无序树:树中任意节点的子节点之间没有顺序关系,这种树称为无序树,也称为自由树;
有序树:树中任意节点的子节点之间有顺序关系,这种树称为有序树;
二叉树:每个节点最多含有两个子树的树称为二叉树;
完全二叉树:对于一颗二叉树,假设其深度为d(d>1)。除了第d层外,其它各层的节点数目均已达最大值,且第d层所有节点从左向右连续地紧密排列,这样的二叉树被称为完全二叉树,其中满二叉 树的定义是所有叶节点都在最底层的完全二叉树;
平衡二叉树(AVL树):当且仅当任何节点的两棵子树的高度差不大于1的二叉树;
排序二叉树(二叉查找树(英语:Binary Search Tree),也称二叉搜索树、有序二叉树);
霍夫曼树(用于信息编码):带权路径最短的二叉树称为哈夫曼树或最优二叉树;
B树:一种对读写操作进行优化的自平衡的二叉查找树,能够保持数据有序,拥有多余两个子树。
树的存储与表示顺序存储:将数据结构存储在固定的数组中,然后在遍历速度上有一定的优势,但因为 所占空间较大,是非主流二叉树,二叉树通常以链式存储。
链式存储:
由于对节点的个数无法掌握,常见树的存储表示都转换成二叉树进行处理,子节点个数最多为2。
二叉树的代码实现二叉树的实现可以通过顺序表(数组) 和 链式结构的形式实现,一般使用链式结构来实现 二叉树的python实现,代码如下:
class Node(object):
"""树节点"""
def __init__(self, item):
self.elem = item
self.lchild = None # 左子节点
self.rchild = None # 右子节点
class Tree(object):
def __init__(self):
self.root = None # 根节点
def add(self, item):
"""增加子节点"""
node = Node(item)
# 如果为空树,则直接将item给根节点
if self.root is None:
self.root = node
return
# 通过队列的结构来实现二叉树的遍历
queue = [self.root]
while queue:
cur_node = queue.pop(0)
# 当前节点的左孩子
if cur_node.lchild is None:
cur_node.lchild = node
return
else:
queue.append(cur_node.lchild)
# 当前节点的右孩子
if cur_node.rchild is None:
cur_node.rchild = node
return
else:
queue.append(cur_node.rchild)
二叉树的遍历
树的遍历是树的一种重要的运算。所谓遍历是指树中所有结点的信息的访问,即依次对树中每个结点访问一次且仅访问一次,我们把这种对所有结点的访问称为遍历。那么树的两种重要的遍历模式是深度优先遍历和广度优先遍历,深度优先遍历一般用递归,广度优先遍历一般用对队列。一般情况下能用递归算法的大部分也能用堆栈来实现。
二叉树添加元素及广度遍历(层次遍历)从上往下,一层一层读取二叉树的元素
class Node(object):
"""树节点"""
def __init__(self, item):
self.elem = item
self.lchild = None # 左子节点
self.rchild = None # 右子节点
class BinaryTree(object):
def __init__(self):
self.root = None # 根节点
def add(self, item):
"""增加子节点"""
node = Node(item)
# 如果为空树,则直接将item给根节点
if self.root is None:
self.root = node
return
# 通过队列的结构来实现二叉树的遍历
queue = [self.root]
while queue:
cur_node = queue.pop(0)
# 当前节点的左孩子
if cur_node.lchild is None:
cur_node.lchild = node
return
else:
queue.append(cur_node.lchild)
# 当前节点的右孩子
if cur_node.rchild is None:
cur_node.rchild = node
return
else:
queue.append(cur_node.rchild)
def breadth_travel(self):
"""广度遍历"""
if self.root is None:
return
queue = [self.root]
while queue:
cur_node = queue.pop(0)
print(cur_node.elem, end=' ')
if cur_node.lchild is not None:
queue.append(cur_node.lchild)
if cur_node.rchild is not None:
queue.append(cur_node.rchild)
print()
if __name__ == '__main__':
tree = BinaryTree()
tree.add(0)
tree.add(1)
tree.add(2)
tree.add(3)
tree.add(4)
tree.add(5)
tree.add(6)
tree.add(7)
tree.add(8)
tree.breadth_travel()
运行结果:
对于一颗二叉树,深度优先搜索(depth first search)是沿着树的深度遍历树的结点,尽可能深的搜索树的分支。
那么深度遍历有重要的三种方法。这三种方式常被用于访问树的结点。它们之间的不同在于访问每个节点的次序不同。这三种遍历分别叫做先序遍历、中序遍历和后序遍历。我们来给出它们的详细定义,然后距离看看他们的应用。
- 先序遍历,在先序遍历中,我们先访问根节点,然后递归使用先序遍历访问左子树,在递归使用先序遍历访问右子树
根节点->左子树->右子树
def pre_order(self, node):
"""先序遍历 根左右"""
if not node:
return
print(node.elem, end=" ")
self.pre_order(node.lchild)
self.pre_order(node.rchild)
- 中序遍历 在中序遍历中,递归使用中序遍历访问左子树,然后访问根节点,最后在递归使用中序遍历访问右子树左子树->根节点->右子树
def in_order(self, node):
"""中序遍历 左根右"""
if not node:
return
self.in_order(node.lchild)
print(node.elem, end=' ')
self.in_order(node.rchild)
- 后续遍历 在后续遍历中,先递归使用后续遍历访问左子树和右子树,最后访问根节点左子树->右子树->根节点
def pos_order(self, node):
"""后序遍历 左右根"""
if not node:
return
self.pos_order(node.lchild)
self.pos_order(node.rchild)
print(node.elem, end=" ")
完整代码实现:
class Node(object):
"""树节点"""
def __init__(self, item):
self.elem = item
self.lchild = None # 左子节点
self.rchild = None # 右子节点
class BinaryTree(object):
def __init__(self):
self.root = None # 根节点
def add(self, item):
"""增加子节点"""
node = Node(item)
# 如果为空树,则直接将item给根节点
if self.root is None:
self.root = node
return
# 通过队列的结构来实现二叉树的遍历
queue = [self.root]
while queue:
cur_node = queue.pop(0)
# 当前节点的左孩子
if cur_node.lchild is None:
cur_node.lchild = node
return
else:
queue.append(cur_node.lchild)
# 当前节点的右孩子
if cur_node.rchild is None:
cur_node.rchild = node
return
else:
queue.append(cur_node.rchild)
def breadth_travel(self):
"""广度遍历"""
if self.root is None:
return
queue = [self.root]
while queue:
cur_node = queue.pop(0)
print(cur_node.elem, end=' ')
if cur_node.lchild is not None:
queue.append(cur_node.lchild)
if cur_node.rchild is not None:
queue.append(cur_node.rchild)
print()
def pre_order(self, node):
"""先序遍历 根左右"""
if not node:
return
print(node.elem, end=" ")
self.pre_order(node.lchild)
self.pre_order(node.rchild)
def in_order(self, node):
"""中序遍历 左根右"""
if not node:
return
self.in_order(node.lchild)
print(node.elem, end=' ')
self.in_order(node.rchild)
def pos_order(self, node):
"""后序遍历 左右根"""
if not node:
return
self.pos_order(node.lchild)
self.pos_order(node.rchild)
print(node.elem, end=" ")
if __name__ == '__main__':
tree = BinaryTree()
tree.add(0)
tree.add(1)
tree.add(2)
tree.add(3)
tree.add(4)
tree.add(5)
tree.add(6)
tree.add(7)
tree.add(8)
tree.add(9)
print('广度遍历:', end=" ")
tree.breadth_travel()
print("先序遍历:", end=" ")
tree.pre_order(tree.root)
print("\n中序遍历:", end=" ")
tree.in_order(tree.root)
print("\n后序遍历:", end=" ")
tree.pos_order(tree.root)
运行结果:
对于根据先序遍历,中序遍历,后序遍历来反推树结构,主要根据先序遍历与中序遍历的组合或者中序遍历与后序遍历的组合即可推出,主要思路:根据先序遍历或者后序遍历先确定根节点,再根据根节点把中序遍历分成左右子树,在子树中继续在应用相同的思路,确定子树的根节点,再分左右子树,直到确定位置。
给出中序遍历结果为:7,3,8,1,9,4,0,5,2,6 ;后序遍历结果:7,8,3,9,4,1,5,6,2,0;还原出此二叉树的树结构
根据后序遍历确定,整个二叉树的根节点为 0;此时,就可以将中序遍历的结果分成左右两个子树,其中左子树 a_left=[7,3,8,1,9,4],右子树a_right = [5,2,6];
既然已经分出了左右子树,那么后序遍历的结果也可以左右子树分出左右子树的后序遍历的结果:左子树a_left的后序遍历结果就是 [7,8,3,9,4,1] ,右子树a_right的后序遍历结果就是 [5,6,2] , 从而确定左右子树的根节点分别为1和 2
接着,根据左右子树的根节点分别将左右子树在分成两部分。重复上的操作。