作者:禅与计算机程序设计艺术
决策树(decision tree)是一个很古老但是应用非常广泛的机器学习模型。在数据挖掘、模式识别、图像处理等领域都有着广泛的应用。如何使用TensorFlow实现决策树呢?本文将从零开始,带领大家实现一个简单版本的决策树模型。
2.基本概念术语说明
1.决策树(Decision Tree):决策树是一种基于树形结构进行分析的监督学习方法,它主要用于分类、回归或预测任务,能够生成高度可interpretation的规则表达式。
2.样本(Sample):指训练集中要被用来建立决策树的数据样本。
3.特征(Feature):指对待预测变量进行观察、衡量、描述或者分类的一组属性或变量。
4.标签(Label):指样本所对应的结果,即类别或连续值变量。
5.节点(Node):决策树由结点(node)构成,每个结点代表一个条件判断,或者叶子结点表示结果。
6.父节点(Parent Node):某个结点的直接上一级结点称为其父节点。
7.子节点(Child Node):某结点的下一级结点称为其子节点。
8.内部节点(Interior Node):除根节点和叶子结点外的所有中间结点。
9.外部节点(External Node):树的外部节点也称为叶子结点。
10.属性(Attribute):指决策树构造过程中的特征选择方式。通常包括所有可能