当前位置:首页|资讯

客户流失预警模型(Logic Regression)

作者:不会想到的名字发布时间:2024-10-18

(一)数据读取与变量划分

注意:python导入Excel文件需要下载第三方库openpyxl

(二)模型搭建与使用

划分训练集和测试集

划分方式是随机的,导致行索引为乱序

模型搭建

预测数据结果

补充知识点:混淆矩阵

预测概率

获取逻辑回归系数

(三)模型评估

1.ROC曲线

ROC曲线需要尽可能地凸向(0,1),AUC值表示曲线下方的面积,一般要达到0.75以上才可以接受

roc_curve返回三个元素,分别为假警报率,命中率,阈值

阈值的意思是:

当一个客户被预测流失的概率大于等于该阈值,才会判定其会流失,后两列计算出在该阈值下的假警报率和命中率

绘制ROC曲线

计算模型的AUC值

2.KS曲线

计算公式:KS = max(TPR - FPR),KS值就是KS曲线的峰值

绘制KS曲线

求出KS值

获取KS值对应的阈值



Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1