跳转至

第12章:信用评分模型案例(现金贷)

案例说明:本评分模型开发项目是某金融服务公司的现金贷产品,现金贷的性质与分期的产品有很大的不同点,就是金额少、期数短和放款速度快。通常很多的现金贷产品标榜30分钟内或更短时间内就能审核完成。因为成本与时效性,很多现金贷的产品不会加入第三方数据源或是仅有少数数据作为参考。

1. 数据样本

本评分模型建立的观察时点(Observation Point)为2016年12月30日,以2016年8月1日至11月30日为开发样本观察期(Observation Period)​。样本数据完全由金融服务公司提供且并无第三方的数据参考,总共有将近47000笔数据。

2. 样本好坏表现定义

因为现金贷快借快还的特性,所以之前讨论的账龄分析滚动率等分析好坏样本的方式不一定适用于这种商品。因此,我们从数据中归纳出,一项还款现状(Status)的字段,里面有三种可能的参数,分别是“正常还款”​“逾期已还”和“逾期未还”我们将“正常还款”定义为好样本,其余两项为坏样本。这样的好坏样本比例将近未3.5:1。

3. 变量分析

金融公司提供的资料源中共有22个不同的字段,经过初步的筛选,选出了9个成为长变量列表(Long List)的成员,分别是年龄、性别、婚姻状况、学历、住房状况、居住省份、职业类型、贷款金额和贷款期数,然后再经由WOE及IV的筛选,选出4项加入短变量列表(Short List)内。在这过程中,每个变量里的IV值除了要大于选择的门槛0.02外,还要再观察变量里的分组是否呈现单调递增或递减的趋势,如表12-1所示。

表12-1:学历分子I

表12-1中显示,虽然整体学历的IV值达到0.02门槛的高达0.059,但是观察WOE的趋势,却无法呈现出单调递增或递减的特性,如图12-1所示。

图12-1:学历WOE趋势图I

因此,我们会用改变分组的方式来把递增或递减的趋势找出来。如表12-2所示,可以通过不同的分类方式不仅让IV值提高到0.066,还能将WOE的趋势性显现出来,如图12-2所示。

表12-1:学历分子II

图12-2:学历WOE趋势图II

按照以上的原则与方法,我们就可以用找出的短变量列表中的字段开始建模。

4. 模型建立与验证

依据上节的字段筛选原则找出了IV值符合标准(至少大于0.02)​,以及每个字段的分组都能呈现单调递增或是递减的趋势。若其中有些分组出现折点的情况(趋势不明显)​,但业务部门或第一线审查人员能够给出合理的解释,或是金融单位为了某些观察或监管,都可以将不符合标准的字段加入短变量列表中作为建模的参数,如表12-3所示的原始资料。

表12-3:原始资料

表12-3:原始资料

接下来,就是将每个参数根据字段分组里面的分类方式,分别把原始数据换成分组的定义,例如“500~1000”​“≤12”​“男”​“初中及以下”​,如表12-4所示。

表12-4:分组数据表I

接下来,就把其中的分组变量分别代入相对应的WOE值,即把“500~1 000”替换为-0.178,把“≤12”替换为0.318,把“男”替换成-0.07。最后,再把“初中及以下”替换成-0.473,其中第一栏的0、1代表的是违约与否的变量,即0代表不违约而1代表违约,也就是我们最后要代入逻辑回归(Logistic Regression)中的Y值,如表12-5所示。

最后,逻辑回归的结果如表12-6所示,其中原本有4个字段加入回归分析,但最后系统只选出3个最有影响力的参数,并且取得截距与各项字段的系数,接下来,就可以根据评分换算的方式及建构评分卡的方法求出各个断点的分数。

表12-5:分组数据表II

参数 自由度 估计值
截距(Intercept) 1 -2.2442
金额(Amount-WOE) 1 -0.7282
性别(Gender-WOE) 1 -0.868
学历(Education-WOE) 1 -0.8279

根据得出的结果可以列出以下的式子:

Y=-2.244 2-0.728 2×(Amount-WOE)-0.868 0×(Gender-WOE)-0.827 9×(Education-WOE)​。接着,我们要求出公式 Score=A+B×ln(Odds)中的 A、B 才能定义出Score。因此,我们假设 Base Score(BS)为 600,Base Odds 为 50,PDO 为 20 时,则可以求出 B=20/ln(2)=28.9,A=600-B×ln(50)=487.1,所以可以把公式转换为 Score=487.1+28.9×ln(Odds)​。再根据逻辑回归方程式,Odds等于各项变量的WOEi及相对应的系数βi及截距α的组合。根据计算可以得到以下分数尺度公式:Score=A+B×{Σ(WOEi×βi)+α}。最后就可以求出每笔交易的Score,再根据这些分数统计出0(Good)/1(Bad)的个数,接下来就可以区分级距了,如表12-7所示。

评分 0(Good) 1(Bad)
530 ~ 540 5342 974
540 ~ 550 9221 1074
550 ~ 560 10848 967
560 ~ 570 6409 451
570 ~ 580 1638 94
580 ~ 590 154 4

接下来,按照公司的授信政策及赢利目标,即可设定现金贷的个人信用评分,例如,几分以上的申请者可以贷款,几分以下的申请者予以拒绝。