上一节我们说了决策分析的基本概念,这一节我们谈谈决策分析常用的三种方法:决策树法、Bayes方法、Markov方法。 决策树法 决策树法(decision tree-based method):是通过确定一系列的条件(if-then)逻辑关系,形成一套分层规则,将所有可能发生的结局的概率分布用树形图来表达,生成决策树(decision tree),从而达到对研究对象进行精确预测或正确分类的目的。 树的扩展是基于多维的指标函数,在医学领域主要用于辅助临床诊断及卫生资源配置等方面。 决策树分类:
决策树的3类基本节点:
从决策节点引出一些射线,表示不同的备选方案,射线上方标出决策方案名称。射线引导到下一步的决策节点、机会节点或结局节点。从机会节点引出的线表示该节点可能出现的随机事件,事件名称标在射线上方,先验概率在下方。每个结局节点代表一种可能的结局状态。在结局节点的右侧标出各种状态的效用(utility),即决策者对于可能发生的各种结局的(利益或损失)感觉和反应,用量化值表示。
绘制决策树基本规则:
决策树分析法步骤: 1 提出决策问题,明确决策目标 2 建立决策树模型--决策树生长 2.1决策指标的选择的两个步骤: 2.1.1 提出所有分值规则 2.1.2 选择最佳规则 2.2 估计每个指标的先验概率 3 确定各终点及计算综合指标 3.1 各终点分配类别 3.2 各终点期望效用值得确定 3.3 综合指标的计算 3.4 计算值排序选优
树生长停止情况:
一棵树按可能长到最大,通常是过度拟合(overfit)的。 训练集:用于决策树模型建立的数据集 测试集:决策树进行测评的数据集。 过度拟合的树需要剪枝,即去掉噪声(拟合中的误差)。剪枝需要兼顾复杂度(节点数目)和预测精度(决策损失)。 决策损失(decision lose):指随机抽取的某一个个体,在树的某决策节点被错误分类所引起的效用损失。
建立决策树的目的在于获得最高精度的分类或预测值,以期为决策提供依据。可按照这几个特性对其评估:准确、简洁、易行、易理解和能发掘复杂数据内在关系。
Bayes方法 在实际决策过程中,决策者通常是将状态变量当作随机变量,状态变量发生的可能性用先验概率(prior probability)表示,以期望值准则(expectation rule)作为选择最优方案的标准。 但是先验概率来源于历史资料和主观判断,有一定偏差。为了提高质量,就需要进行实验、抽样等工作计算出当前条件下的概率,这就是后验概率(posterior probability)。后验概率是对先验概率的修正。 根据自然状态的先验概率和条件概率,利用样本信息求得后验概率并进行决策的方法就称为贝叶斯决策(Bayesian decision)。
基本步骤:
Markov方法 马尔科夫模型(Markov model):是利用某一变量的现在状态和动向来预测该变量未来的状态及动向,以辅助决策的一种分析方法。 马尔科夫模型与其他模型的主要区别是:它不需要从复杂的预测因子中寻找各因素之间的相互规律,而只需要考虑事件本身的历史状况及演变特点,通过计算状态转移概率预测自身状态的变化。 马尔可夫链为状态空间中从一个状态到另一个状态转换的随机过程。该过程要求具备“无记忆”的性质:即已知现在状态,将来状态与过去状态相互独立。这种特定类型的“无记忆性”称作马尔可夫性质。在马尔可夫链的每一步,系统根据条件概率保持现有状态或转为其他状态。状态的改变叫做转移,状态改变概率称为转移概率。 马尔科夫模型优于决策树发的特点主要有两个方面:
马尔科夫模型当前应用非常火热,什么机器学习,人工智能等等几乎都是必须提到,google的网页排序计算就是依据这个模型计算的。但是模型还是有点复杂,大家知道就可以了。
|
|