
传统评分卡(logistic regression)
传统评分卡一直在银行信贷业务中成功实践了几十年,其优势在于:泛化性强,稳定性好,线性模型可解释性强。少样本就可以训练模型。其劣势在于:特征要求强相关,线性特征对于挖掘的信息价值相对有限,模型效果相当若与机器学习算法。
机器学习风险模型(Machine Learning)
随着大数据的出现,机器学习慢慢焕发出其生命力,如Random Forest、GBDT、XGBoost、LightGBM等集成学习方法在风险模型中得到广泛应用,可以通过集成学习将弱分类器打造出强分类模型。其优势在于:引入了非线性因素,模型拟合能力更强;支持更多弱特征入模,而不必像评分卡模型需要花大量时间筛选特征。而其劣势在于:由于引入了大量的非线性因素,模型可解释性降低;容易产生过拟合现象,泛化能力下降。