章节 01
德国二手车市场价格预测项目导读
本文基于德国AutoScout24平台46000多条二手车数据,通过数据清洗、探索性分析及机器学习建模,揭示影响二手车价格的关键因素,并对比线性回归、随机森林和梯度提升三种模型的预测效果。核心发现包括:马力是价格最强预测因子;随机森林模型在精度与效率上表现最优。项目来源为GitHub上的autoscout24-analysis项目(作者Andrii Semenov),并提供Tableau交互式仪表板。
正文
本文介绍一个基于德国AutoScout24平台46000多条二手车 listings 的数据分析项目,通过数据清洗、探索性分析和机器学习模型构建,揭示影响二手车价格的关键因素,并对比线性回归、随机森林和梯度提升三种模型的预测效果。
章节 01
本文基于德国AutoScout24平台46000多条二手车数据,通过数据清洗、探索性分析及机器学习建模,揭示影响二手车价格的关键因素,并对比线性回归、随机森林和梯度提升三种模型的预测效果。核心发现包括:马力是价格最强预测因子;随机森林模型在精度与效率上表现最优。项目来源为GitHub上的autoscout24-analysis项目(作者Andrii Semenov),并提供Tableau交互式仪表板。
章节 02
德国作为欧洲最大汽车市场之一,二手车交易活跃,但人工评估价格难以全面把握品牌、车龄、里程、马力等多因素的交互作用。本项目旨在通过数据科学技术回答以下问题:
章节 03
数据集来自AutoScout24平台2011-至2021年的二手车 listings,原始含46405条记录,字段包括品牌、型号、燃料类型、变速箱类型、里程、马力、年份、价格等。预处理步骤:
章节 04
市场格局与价格驱动因素分析:
章节 05
构建并对比三种回归模型:
| 模型 | 平均绝对误差 (MAE) | R² 分数 |
|---|---|---|
| 线性回归 | 2,704 欧元 | 0.80 |
| 随机森林 | 1,615 欧元 | 0.91 |
| 梯度提升 | ~1,643 欧元 | 0.91 |
分析:
章节 06
项目结果对多方有实际价值:
章节 07
局限性:
总结: 本项目验证了机器学习在二手车价格预测中的有效性。关键在于扎实的数据预处理、深入的探索性分析及科学的模型选择。这些原则可迁移到房地产估价、设备残值评估等类似场景。