章节 01
Rossmann销售预测实战:核心思路与价值导读
基于德国1115家Rossmann药店真实数据的销售预测项目,通过K-Means聚类、梯度提升、随机森林和神经网络实现六周前瞻预测,将技术成果与运营决策紧密结合,为库存管理、人员排班和促销规划提供数据支持。
正文
基于德国1115家Rossmann药店真实数据的销售预测项目,通过K-Means聚类、梯度提升、随机森林和神经网络实现六周前瞻预测,为运营决策提供数据支持。
章节 01
基于德国1115家Rossmann药店真实数据的销售预测项目,通过K-Means聚类、梯度提升、随机森林和神经网络实现六周前瞻预测,将技术成果与运营决策紧密结合,为库存管理、人员排班和促销规划提供数据支持。
章节 02
Rossmann是欧洲最大的连锁药店品牌之一,在德国运营超过3000家门店。准确的销售预测是库存管理、人员排班和促销规划的基础,预测偏差会导致库存积压或缺货。项目关注预测与运营决策结合,核心问题是驱动1115家门店日销售额波动的因素及六周前瞻预测可能性。
章节 03
使用Kaggle竞赛数据集:2013-2015.7训练数据(约101万条)、2015.8-9测试数据(约4.1万条),含门店信息和交易数据。清洗步骤:删除空列、填充缺失竞争距离(中位数2325米)、移除营业但销售额为0的记录、统一StateHoliday字段格式。
章节 04
门店特征:B类门店日均销售额10060欧元(D类5738欧元),B级商品组合客单价最高;时间因素:周一销售额最高,12月峰值、7月低谷;促销:当日促销提升81%,周期性邮寄促销效果弱;竞争:新对手开业初期冲击大;外部:州假日对特定门店正向影响显著。
章节 05
扩展至25字段,核心特征:CompetitionOpen(竞争对手开业月数)、LogCompetitionDistance(距离对数变换)、IsPromo2Month(促销周期标记),这些特征显著提升模型性能。
章节 06
K-Means聚类划分门店群组;对比算法:梯度提升(GBM)最佳(高销量群组RMSPE22.3%)、随机森林稳健、神经网络表现弱;训练分快速迭代(40%样本)和全数据模式。
章节 07
测试集生成41088条预测,22.3%RMSPE在零售领域可接受。预测支持:库存优化订货、人员排班调整、促销策略评估。
章节 08
业务理解优先于模型调优;特征工程需结合领域知识;模型评估对齐业务目标。项目结构清晰可复现,为数据科学学习者提供完整参考模板。