章节 01
【导读】电商数据分析实战:配送时效决定客户满意度
本项目基于巴西电商平台Olist的真实交易数据,完成了从SQL数据清洗、Power BI可视化、Python探索性分析到机器学习建模的端到端分析。核心发现为:配送表现是客户满意度的最强驱动因素。项目覆盖完整业务链路,为电商运营提供数据驱动的决策依据。
正文
一个完整的巴西电商数据分析项目,涵盖SQL数据清洗、Power BI可视化、Python探索性分析和机器学习建模,核心发现是配送时效对客户满意度的决定性影响。
章节 01
本项目基于巴西电商平台Olist的真实交易数据,完成了从SQL数据清洗、Power BI可视化、Python探索性分析到机器学习建模的端到端分析。核心发现为:配送表现是客户满意度的最强驱动因素。项目覆盖完整业务链路,为电商运营提供数据驱动的决策依据。
章节 02
使用Olist巴西电商数据集,包含订单、客户、卖家、商品、支付、配送和评价等完整信息。关键数据规模:
章节 03
关键决策:评价数据聚合、支付数据汇总、商品分类标准化、订单商品行合并、缺失值业务化处理,形成统一视图analysis_orders_master。
涵盖订单状态分布、月度营收趋势、高营收品类识别(健康美容、手表礼品等)。
数据存储:SQLite;查询:SQL;处理:Python/Pandas;可视化:Matplotlib/Power BI;机器学习:Scikit-learn/XGBoost/LightGBM;开发环境:Jupyter/VS Code。
章节 04
章节 05
二分类预测:低分评价(1)/非低分评价(0),排除未评价订单。
移除与评价直接相关列避免数据泄露,基于配送、支付等属性建模。
测试多种算法后,选择阈值调优的随机森林,表现:
延迟天数、订单是否已配送、配送天数等为核心特征。
属配送后风险模型,无法事前预警,建议构建配送前预测模型。
章节 06
Power BI仪表板提供总订单数、延迟率、月度趋势等关键指标,支持管理层决策。