章节 01
【导读】银行营销机器学习项目:从亏损到盈利的核心实践
BYU-Idaho CSE450课程团队项目针对银行电话营销的类别不平衡问题(正例仅11.4%),采用SMOTE过采样、类别权重、概率阈值调优及多模型对比(随机森林、集成堆叠等技术),将营销活动从亏损转为盈利,同时生成可解释的客户洞察。
正文
BYU-Idaho CSE 450课程团队项目,使用SMOTE过采样、类别权重和概率阈值调优解决类别不平衡问题,将电话营销从亏损转为盈利。
章节 01
BYU-Idaho CSE450课程团队项目针对银行电话营销的类别不平衡问题(正例仅11.4%),采用SMOTE过采样、类别权重、概率阈值调优及多模型对比(随机森林、集成堆叠等技术),将营销活动从亏损转为盈利,同时生成可解释的客户洞察。
章节 02
银行电话营销面临效率低、成本高问题,尤其类别不平衡(正例占比10-15%)导致传统模型无业务价值。项目使用UCI银行营销数据集(约37000条记录,正例占11.4%),特征涵盖客户基本信息、金融状况、联系历史及宏观经济指标。
章节 03
团队构建三种模型:1.随机森林+SMOTE过采样+手动类别权重;2.平衡随机森林(自动类别权重);3.集成堆叠(RF+KNN基学习器+逻辑回归元学习器,阈值调优至0.61)。类别不平衡处理技术包括SMOTE插值生成合成样本、类别权重调整、概率阈值优化。
章节 04
无ML筛选时测试集亏损$157;最佳模型后盈利$824,规模化至4119人预计盈利$7775。客户洞察:高转化群体(历史转化客户、学生、退休人员),低转化群体(固定电话客户、蓝领工人),精确率从11.5%提升至47.2%。
章节 05
成功关键:业务问题驱动(聚焦盈利目标)、选择业务相关评估指标(非准确率)、重视可解释性(生成客户洞察)、迭代优化(从简单到复杂模型)。
章节 06
模型层面:深度学习、时间序列、强化学习;业务层面:个性化推荐、联系时机优化、客户生命周期价值预测;技术层面:实时推理、A/B测试、模型监控。