注意:python导入Excel文件需要下载第三方库openpyxl
划分训练集和测试集
划分方式是随机的,导致行索引为乱序
模型搭建
预测数据结果
补充知识点:混淆矩阵
预测概率
获取逻辑回归系数
ROC曲线需要尽可能地凸向(0,1),AUC值表示曲线下方的面积,一般要达到0.75以上才可以接受
roc_curve返回三个元素,分别为假警报率,命中率,阈值
阈值的意思是:
当一个客户被预测流失的概率大于等于该阈值,才会判定其会流失,后两列计算出在该阈值下的假警报率和命中率
绘制ROC曲线
计算模型的AUC值
计算公式:KS = max(TPR - FPR),KS值就是KS曲线的峰值
绘制KS曲线
求出KS值
获取KS值对应的阈值