决策树
什么是决策树༟
决策树一般都是自上而下的来生成的。每个决策或事件༈即自然状态༉都可能引出两个或多个事件༌导致不同的结果༌把这种决策分支画成图形很像一棵树的枝干༌故称决策树。
决策树就是将决策过程各个阶段之间的结构绘制成一张箭线图༌我们可以用下图来表示。
.png)
选择分割的方法有好几种༌但是目的都是一致的༚对目标类尝试进行最佳的分割。
从根到叶子节点都有一条路径༌这条路径就是一条“规则”。
决策树可以是二叉的༌也可以是多叉的。
对每个节点的衡量༚
1) 通过该节点的记录数
2) 如果是叶子节点的话༌分类的路径
3) 对叶子节点正确分类的比例。
有些规则的效果可以比其他的一些规则要好。
决策树对于常规统计方法的优缺点
优点༚
1) 可以生成可以理解的规则。
2) 计算量相对来说不是很大。
3) 可以处理连续和种类字段。
4) 决策树可以清晰的显示哪些字段比较重要 缺点༚
1) 对连续性的字段比较难预测。
2) 对有时间顺序的数据༌需要很多预处理的工作。
3) 当类别太多时༌错误可能就会增加的比较快。
4) 一般的算法分类的时候༌只是根据一个字段来分类。
利用决策树评价生产方案
决策树是确定生产能力方案的一条简捷的途径。决策树不仅可以帮助人们理解问题༌还可以帮助人们解决问题。决策树是一种通过图示罗列解题的有关步骤以及各步骤发生的条件与结果的一种方法。近年来出现的许多专门软件包可以用来建立和分析决策树༌这样༌利用这些专门软件包༌解决问题就变得更为简便了。
决策树由决策结点、机会结点与结点间的分枝连线组成。通常༌人们用方框表示决策结点༌用圆圈表示机会结点༌从决策结点引出的分枝连线表示决策者可作出的选择༌从机会结点引出的分枝连线表示机会结点所示事件发生的概率。
在利用决策树解题时༌应从决策树末端起༌从后向前༌步步推进到决策树的始端。在向前推进的过程中༌应在每一阶段计算事件发生的期望值。需特别注意༌如果决策树所处理问题的计划期较长༌计算时应考虑资金的时间价值。
计算完毕后༌开始对决策树进行剪枝༌在每个决策结点删去除了最高期望值以外的其他所有分枝༌最后步步推进到第一个决策结点༌这时就找到了问题的最佳方案。
下面以南方医院供应公司为例༌看一看如何利用决策树作出合适的生产能力计划。
南方医院供应公司是一家制造医护人员的工装大褂的公司。该公司正在考虑扩大生产能力。它可以有以下几个选择༚什么也不做༛建一个小厂༛建一个中型厂༛建一个大厂。新增加的设备将生产一种新型的大褂༌目前该产品的潜力或市场还是未知数。如果建一个大厂且市场较好就可实现$100༌000的利润。如果市场不好则会导致$90༌000的损失。但是༌如果市场较好༌建中型厂将会获得$40༌000༌市场不好则损失$5༌000。当然༌还有一个选择就是什么也不干。最近的市场研究表明市场好的概率是0.4༌也就是说市场不好的概率是0.6。参下图༚
.png)
在这些数据的基础上༌能产生最大的预期货币价值༈EMV༉的选择就可找到。
- EMV༈建大厂༉=༈0.4༉*($100,000)+(0.6)*(-$90,000)=-$14,000
- EMV༈中型厂༉=(0.4) *($ 600,000))+(0.6)* (-$10,000)=+$18,000
- EMV(建小厂)=(0.4)* ($40,000)+(0.6)*(-$5,000)=+$13,000
- EMV(不建厂)=$0
"


