信用评分：第二部分

卜范涛讲风险 2022-03-21

展开全文

作者：Natasha Mashanovich,

基本原理

信用评分 = money?.png

“伟大的设计是通过简单性呈现的极大复杂性。（M.Cobanli）”- 作为数据科学家，我的责任是设计和开发准确的，有用的和稳定的信用风险模型。我还需要确保其他数据科学家和业务分析师可以评估我的模型或复制相同的步骤并产生相同或相似的结果。

在模型开发过程中，我试图从业务中找到许多问题的答案。这些答案有时需要主观判断。只要我能记录我的问题和相应的答案，这种主观主义就没有什么不对。显然，如果我持续将这些问题和答案添加到列表中，那么就有可能最终得到一张难以理解的庞大列表。我也可能最后提出一些重复的问题，甚至是矛盾的答案。

我怎么能确定：（1）我不会错过重要问题的答案; （2）我的模型能否成功通过同行评审或审计过程; 或（3）我的同事能否复制模型结果？

为了满足上述要点，我需要：

系统的步骤 - 方法 - 我将遵循以确保最佳实践;
一个支持结构 - 理论框架 - 我将开始填写我的答案;
信用风险模型重要特征的描述 - 模型设计 - 证明商业利益，如产生更高的利润。

一旦我确定了这些重要元素，我就可以开始在我的理论框架的正确桶中填写我的问题，然后继续设计和构建模型。该过程可能如下所示：

问题1：我如何区分客户的“好”与“坏”？他们逾期60天，90天或180天？
答案1：这是我的模型设计的一部分。我将从业务中寻求答案，并将其记录在“操作定义”下。
问题2：当模型预测“坏”/“好”客户时，结果期应该多长时间？我应该确定那段时间的日期或长度吗？
答案2：这也是我的模型设计的一部分。同样，我需要与业务部门核实他们期望模型预测的内容。我将在“性能窗口”下提交此答案。一旦我建立了定义和结果期，我就可以从我的数据中导出结果变量，这将构成我的框架的一部分。
问题3：谁应该被纳入分析？我是否需要排除欺诈客户或处于“好”和“坏”状态之间的客户？
答案3：在我的模型设计中，我需要添加一个包含所有假设的列表，以便我可以要求业务部门确认。
问题4：区分“好”/“坏”客户的主要特征是什么？
答案4：这是我理论框架的一部分，特别是对自变量的识别。我将进行数据探索，以建立客户特征与结果变量之间的关系。例如，“有固定收入的客户不太可能违约”或“年长客户不太可能违约”。用科学术语来说，每个特征（例如收入或年龄）代表了使用统计方法（如逻辑回归）检验显著性的假设。基于统计分析，我可以决定是否在模型中保留这些变量。
等等…
后续部分更详细地描述了记分卡建模方法。

开发方法

任何商业，研究或者软件项目都需要一种合理的方法，通常采用理论或概念框架的形式。框架的目的是描述步骤的顺序及步骤间的相互作用。这确保了所有重要阶段的实施，提供了对项目本身的理解，设定了重要的里程碑，并在项目利益相关者之间建立了积极的合作关系。

通常，可以采用不止一种既定方法。数据挖掘项目是可以使用多个概念框架的典型示例。数据挖掘通常涉及用于商业目的的预测模型的开发。具有多学科性质的数据挖掘项目需要从不同角度加以考虑，包括：

业务 - 用于评估潜在的业务收益
数据科学 - 用于创建理论模型
软件开发 - 用于开发可行的软件解决方案
每个观点可能需要单独的方法，但为了适应上述观点，至少需要两个方法。两种常用方法的例子是Agile-scrum和CRISP-DM（跨行业标准数据挖掘流程）; 前者用于解决业务和软件开发需求，后者用于构建业务模型。

Agile-scrum方法是一种时间盒式的迭代式软件开发方法，可逐步构建软件，其关键目标是为业务提供价值。该方法促进了用户的积极参与，利益相关者之间的有效互动和频繁的交付。因此，它非常适合数据挖掘项目，这些项目通常在短时间内进行，需要经常更新以应对不断变化的经济环境。

CRISP-DM是数据挖掘过程模型的主要行业方法。它由六个主要的互连阶段组成：（1）业务理解，（2）数据理解，（3）数据准备，（4）建模，（5）评估，和（6）部署。

图1. CRISP-DM - 数据挖掘框架

预测模型的最终目标是满足特定业务需求，以提高业务和业务流程的性能。业务和数据理解都是CRISP-DM的关键阶段。这两个阶段的结果应该是一个合理的理论框架和模型设计。

理论框架与模型设计

一个理论框架是一个构建块的基础，可以帮助确定一些重要的因素及其在（假设的）预测模型的关系，如信用风险模型。目标是制定一系列假设并决定一种建模方法（例如逻辑回归）用于检验这些假设。然而，更重要的是建立复制/验证结果的方法，以获得对模型严格性的更强信任。

该框架的关键要素是：（1）因变量（标准），例如“信用状态”，（2）独立变量或预测变量，如年龄，住宅和就业状况，收入，银行账户明细，支付历史，或坏账历史，以及（3）可测试的假设，例如“房主不太可能违约”。

该模型的设计应遵循的研究设计方法，对数据采集，测量和数据分析蓝图的公认原则，因此该模型可以用于可靠性和有效性进行测试。前者测试模型产生稳定和一致结果的程度，后者测试模型是否真正代表我们试图预测的现象，即“我们是否构建了正确的东西？”

一个好的模型设计应记录以下内容：

分析单位（例如客户或产品级别），
人口框架（例如，通过贷款申请者）和样本规模，
操作定义（例如，“坏”的定义）和建模假设（例如，排除欺诈客户），
观察的时间范围（例如，客户过去两年的支付历史）和绩效窗口，即“坏”定义适用的时间范围，
数据源和数据收集方法。

图2.利用历史数据预测未来结果

观察和表现窗口的长度取决于设计模型的行业部门。例如，在银行业中，与电信行业相比，两个窗口通常都更长，其中产品的频繁变化需要更短的观察和表现窗口。

申请评分卡通常应用于新客户，并且没有观察窗口，因为客户使用申请时已知的信息进行评分。征信局数据等外部数据主导了此类评分卡的内部数据。行为评分卡具有利用内部数据的观察窗口，并且倾向于具有比申请评分卡更好的预测能力。

不同的评分卡贯穿使用于客户的整个生命周期中，首先从申请活动开始，以预测客户响应营销活动的可能性。在申请阶段，可以用多种预测模型对客户进行评分，例如他们违反信用义务的可能性或者预测欺诈客户。一系列行为评分卡模型将应用于现有客户，以预测违约概率，以设置信用额度和利率，或计划追加销售和交叉销售活动; 保留活动流失的可能性或预测还贷的可能性或催收目的的“自我修复”概率。