当前位置：首页 > 网海拾贝 > 正文内容

什么是决策树

shisansang5年前 (2021-05-15)网海拾贝989

1. 什么是决策树

1.1 决策树的基本思想

其实用一下图片能更好的理解LR模型和决策树模型算法的根本区别，我们可以思考一下一个决策问题：是否去相亲，一个女孩的母亲要给这个女海介绍对象。

大家都看得很明白了吧！LR模型是一股脑儿的把所有特征塞入学习，而决策树更像是编程语言中的if-else一样，去做条件判断，这就是根本性的区别。

1.2 “树”的成长过程

决策树基于“树”结构进行决策的，这时我们就要面临两个问题：

“树”怎么长。
这颗“树”长到什么时候停。

弄懂了这两个问题，那么这个模型就已经建立起来了，决策树的总体流程是“分而治之”的思想，一是自根至叶的递归过程，一是在每个中间节点寻找一个“划分”属性，相当于就是一个特征属性了。接下来我们来逐个解决以上两个问题。

这颗“树”长到什么时候停

当前结点包含的样本全属于同一类别，无需划分；例如：样本当中都是决定去相亲的，属于同一类别，就是不管特征如何改变都不会影响结果，这种就不需要划分了。
当前属性集为空，或是所有样本在所有属性上取值相同，无法划分；例如：所有的样本特征都是一样的，就造成无法划分了，训练集太单一。
当前结点包含的样本集合为空，不能划分。

1.3 "树"怎么长

在生活当中，我们都会碰到很多需要做出决策的地方，例如：吃饭地点、数码产品购买、旅游地区等，你会发现在这些选择当中都是依赖于大部分人做出的选择，也就是跟随大众的选择。其实在决策树当中也是一样的，当大部分的样本都是同一类的时候，那么就已经做出了决策。

我们可以把大众的选择抽象化，这就引入了一个概念就是纯度，想想也是如此，大众选择就意味着纯度越高。好，在深入一点，就涉及到一句话：信息熵越低，纯度越高。我相信大家或多或少都听说过“熵”这个概念，信息熵通俗来说就是用来度量包含的“信息量”，如果样本的属性都是一样的，就会让人觉得这包含的信息很单一，没有差异化，相反样本的属性都不一样，那么包含的信息量就很多了。

扫描二维码推送至手机访问。

返回列表

上一篇：苦命人的来由～不要做金钱和情绪的奴隶

下一篇：《滕王阁序》和《岳阳楼记》谁更精彩？两部经典，两种魅力人生！

发表评论

« 2025年6月 »
一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

搜索

控制面板: 您好，欢迎到访网站！
登录后台查看权限

标签列表

最新留言

什么是决策树

1. 什么是决策树

1.1 决策树的基本思想

1.2 “树”的成长过程

这颗“树”长到什么时候停

1.3 "树"怎么长

发表评论

粤ICP备14068171号

Powered By Z-BlogPHP. Theme by TOYEAN.

什么是决策树

1. 什么是决策树

1.1 决策树的基本思想

1.2 “树”的成长过程

这颗“树”长到什么时候停

1.3 "树"怎么长

发表评论取消回复

粤ICP备14068171号

Powered By Z-BlogPHP. Theme by TOYEAN.

发表评论