第6章：拒绝推论（Reject Inference）的原因与方法¶

申请评分卡是用审核者的历史数据来建立模型，此模型会忽略原先被拒绝客户的影响力，使得模型略显乐观，因此，需通过拒绝推论来对模型进行修正，以使模型更加精确及稳定。

以图6-1为例，共有申请9 000件，其中接受6 000件，3 000件被拒绝，拒绝推论就是要用各种方法来推估这3000件被拒绝的案件中有多少是真实违约的，有多少是被误拒的。

1. 拒绝推论的原因¶

所有模型开发建立皆是用已知数据来推测的，例如，使用已知的好/坏件为样本，利用过去的数据来推测好/坏件应有的表现，但对于申请评分卡而言，评分卡开发应是用来预测所有申请者的行为，而样本却仅是应用过去“已核准”的申请者来建模，此种状况会造成样本的偏误，也就是母体样本内未表达出被拒绝者的行为表现，因此，必须利用拒绝推论来推测这些未知的样本。

拒绝推论是推论过去被拒绝者并估计他们的行为，可能是一群坏客户被核准，也可能是一群好客户被拒绝，这种推论根据100%的核准率重新建立样本，使得评分卡开发程序更加完整且适当。

进行拒绝推论的原因主要是为了防止申请样本产生偏误，进而还原申请当时母体的真实分配情形，其他进行拒绝推论的原因如下。

增加建模样本数量：此说法类似于防止样本偏误的原因。一般而言，建模样本只考虑核准件，占全体样本的比例太小，进行拒绝推论可增加建模样本占全体样本的比例，所建立的模型也更具代表性。
公司内部政策的变动可能导致过去的申请者已不能代表未来的申请者；同样，过去拒绝不代表未来还会被拒绝，因此，若仅以核准件建立模型可能会造成误判。
从做决策的角度来看，拒绝推论可以对所有申请客户做出更正确而真实的推测。举例来说，某家银行传统上核准评分卡分数大于或等于500分以上的客户，但觉得现行政策过于保守，想要改为核准450分以上的客户，如果此银行从未核准过500分以下的客户，就无法得知此举会增加多少风险。而拒绝推论则允许估算没有被核准过案件的核销率，并能帮助银行做出决策。
用拒绝推论还可能找出过去被拒绝的好客户，发掘这些客户，进而改善内部流程，并找出可增加的利益。

当然，拒绝推论也有其适合使用的时机，举例如下。

高核准率且对判断的信心很强时，不适用。此时因核准率过高，且对决策有高度的信心，因此，可以假设被拒绝的人均为坏人。
高核准率，不管核销率如何，不适用。高核销率，因为高核准率的母体已经接近所有申请件，代表此时母群体大多无核销，不管有没有做拒绝推论影响都不大。低核销率，同理如上，此时可做“被拒绝的都是坏人”的推论。
中低核准率适用。配合适当的风险策略，拒绝推论可以协助其找到更适合的客户。

加入拒绝推论后，申请模型的建立流程如图6-2所示：

2. 拒绝推论的方法¶

拒绝推论的方法有很多种，以下仅列出10种方法做初步的介绍。

2.1 所有的拒绝件皆为坏件¶

此方法较不恰当，因为在拒绝数据中某部分可能是好客户，可能因此而降低模型的精确性。当然，如果在很高的核准率下，例如，95%以上，且征审有很高的判断能力，在一定可靠程度下，就可以假设所有拒绝件皆为坏件。

2.2 指派拒绝客户依现行和核准件好坏比做推论¶

此法假设现行判断系统是非常公正没有偏误的。但假设这样的比例并无任何帮助，需要加以相关的计算与模拟才能相得益彰。

2.3 忽略所有拒绝的客户¶

此方法是假设没有这些拒绝客户的存在，顺便也把低于切分点的客户一律拒绝，其步骤如下：

利用所有核准件建立评分模型。
再次评分，将低于切分点的人全部视为拒绝件。

但此方法只是事后评论现行系统，与现行系统或征审流程毫无关系，一般并不使用此方法。

2.4 核准所有的申请件¶

此方法是找出拒绝客户的真正的表现，这样会与某段特定时间核准客户有关联，由此可得知样本真正核准的客户表现，这种方法是最实际且科学的方法，不会有太保守或过多的核销率。

举例来说，假设建立一个模型需要2 000个坏人，有1500名是来自核准客户，500名是来自应被拒绝的客户，而这些客户约有25%是坏人，此时需要有2 000个临界点之下的客户，其选择方法有三。

在某一特定期间内，核准所有的申请件，直到搜集到2 000个客户为止，如图6-3所示。
在某一特定期间内，核准所有高于原始模型临界点的申请件，但随机核准低于临界点的，直到人数符合所需样本数。
在某一特定时间内，核准原有模型临界点上下10～20分的申请件，但随机核准此核准点区间的客户。

若有够多的客户，建议收集跨几个月的资料，以避免受到季节变化的影响。另外，一种损失较低的做法是：核准给临界点以下的客户较低的额度。此方法可能需要克服法律规定，因为核准某些但拒绝其他相同特性的客户，或是随机核准申请可能会产生客诉等问题。此方法虽较为实际且科学，但也是较费时的做法。

2.5 以内部或行外数据为基础的方法¶

2.5.1 两张评分卡交互运用¶

此方法是针对在某一产品被拒绝而在另一类似产品却被核准的客户，用内部数据来分析其行为表现。如被信贷申请评分卡拒绝的客户，该客户也是本行信用卡客户，则可用信用卡评分卡做评分，观察该拒绝户的表现。

2.5.2 利用行外数据¶

本行所拒绝的客户而其他公司却核准的客户，可利用其在他行的外部数据来追踪该客户的行为表现。

此方法接近真正的表现，但仍有其缺点存在。例如，同一公司的两张评分卡，此卡只能改善某一张卡的表现，但实际核销仍会发生，对于行内的资产质量并无改善。另外，在管理方面的障碍是无法取得被拒绝客户的信用评分记录，除了权限或时间上的限制外，还有一个资法因素，让银行不一定能收集或买到该客户的相关资料。

假设需要将数据拿来做行内的交叉利用，要注意以下几点：

需要相同的时间起讫点，以避免因时间的不同而造成季节偏误。
好坏的定义要接近。
样本数不会太多：因为坏客户申请同一家行库的产品，可能在申请第二张评分卡时被拒绝。

2.6 分配法（Parceling）¶

此法是按照每一个区间的好坏比例重新分配好坏件，并将拒绝件分配到每一个分数级距中，其包含以下步骤：

使用已知的好/坏件样本，建立初步评分卡模型。
使用第一阶段模型来评价所有的拒绝件，并且估算它们的预期违约概率。
将已知的好/坏件样本按照评分分数高低进行分组，计算各分组内的实际违约率。
同样，将拒绝件按照前步骤的分数进行分组。以各分组的实际违约率作为抽样比例，随机抽取该分组下的拒绝件，并指定其为坏件，其余则为好件。
将这些已推论为好/坏件的拒绝件样本新增到原有的核准件样本中，并且重新建立评分卡模型。

举例来说，表6-1是核准及拒绝件在评分卡分数的分配，其中拒绝件是利用核准件的评分卡来判断其分数分配，至于拒绝件的好坏分配，则是利用核准件的Bad%及Good%去分配，例如，在753～850中有605件被拒绝，其在核准件的Bad%＝10.6%，因此，会有64件拒绝件被分配至坏件（605×10.6%），而好件则为541件（605×89.4%）。

2.7 硬性截断法（Hard Cutoff）¶

硬性截断法又称单纯扩张法（SimpleAugmentation），其方法类似Parceling法，但是HardCutoff是将所有拒绝件按照给定分数分配到坏件或好件，而Parceling法则是在不同分数区间内，按照不同比例，分配拒绝件到每一个分数级距里。Hard Cutoff法步骤如下：

使用已知的好/坏件样本建立评分卡模型。
使用评分模型来为所有拒绝件评分，并建立预期核销率P（Bad）。
设定一个核销水平区分好坏件，在此核销水平以上视为坏件，以下视为好件。
将推论拒绝件的好坏重新置于模型中并建立评分卡模型。

举例来说，此方法为模拟申请时核准拒绝比例来对样本的拒绝件做适度的加权。以图6-4为例，申请母体的核准件与拒绝件分配的比例分别为70%与30%，建模样本核准件与拒绝件分配的比例为66.6%与33.3%，则可推测建模样本拒绝比例稍高，需要用母体比例来加权调整，因此，可调整拒绝件的比重为（66.6% /33.3%）/（70%/30%）＝0.8574。

2.8 模糊法（Fuzzy）¶

模糊法不是指定样本为好/坏件，而是将每个拒绝件样本拆为部分的坏件与好件。模糊法步骤如下：

用已知核准件样本的模型来对拒绝件评分并估算违约概率。
按照估算的违约率对每一个拒绝件算出P（Good）及P （Bad）。
将被拒绝件样本分为好件及坏件两样本。将坏件加权上估计的违约概率，好件则加权上非违约件的概率。
将拒绝件与核准件的样本结合，重新建立评分卡模型。

2.9 迭代再分类法（Iterative Reclassification）¶

此法类似Hard Cutoff，但此方法是重复分组直到某一临界值为止。此方法步骤如下：

根据核准案件建立评分卡。
用现有的模型对拒绝客户加以评分。评分后用每个区间的好坏比做拒绝客户的好坏比，并随机给定好件或坏件。
给定后合并核准件，重新建立模型，直到指定的统计量收敛为止，比如，可用ln（Odds）vs.score的散布图，或用模型的参数达到一定的收敛区间等。
若使用好坏比与模型的图标法，需要注意所有的线都要在已知的好坏比线下，否则，会有拒绝客户比核准客户质量好的问题出现。