简单代码示例
1.分类决策树模型
2.回归决策树模型
员工离职预测模型
1.模型搭建
1.1.数据读取与预处理
1.2.提取特征变量和目标变量
1.3.划分训练集和测试集
1.4.模型训练及搭建
2.模型预测及评估
2.1.预测是否离职
2.2.预测离职概率
2.3.模型预测效果评估
绘制ROC曲线
求出AUC值
2.4.特征重要性评估
以CART决策树为例,模型分裂到最后的叶子节点,整个系统的基尼系数下降a,而根据某一特征变量进行分裂的节点产生的基尼系数下降值之和为b,那么该特征的重要性计算为(b/a)*100%
3.模型可视化
4.参数调优
4.1 k-fold cross validation
scoring参数用以设置模型的评估方法,默认为准确度,也可以计算其AUC值
4.2 单参数调优
新模型的AUC值为0.985,相比于原来的0.976有所提高
值得注意,模型深度增加后,特征重要性也随之改变
4.3 多参数调优
注意:若某参数的优化值是给定范围的边界值,需要额外增大范围继续调优