章节 01
【导读】大语言模型能否预测电力需求?14种模型对比揭示真实能力边界
本研究系统对比了统计模型、机器学习、深度学习及大语言模型(共14种配置)在比利时电网电力负荷预测任务中的表现,旨在揭示LLM在时序预测领域的能力边界。研究使用近10年的比利时电网数据,核心发现包括:Time-LLM(通过重编程层适配GPT-2的架构)表现优于传统XGBoost和LSTM;直接提示GPT-4o进行预测效果不佳;集成模型(XGB+LSTM+Time-LLM)取得最佳性能。
正文
一项系统研究对比了统计模型、机器学习、深度学习和大语言模型在电力负荷预测任务上的表现,涵盖ARIMA到GPT-4o共14种配置,揭示了LLM在时序预测领域的真实能力边界。
章节 01
本研究系统对比了统计模型、机器学习、深度学习及大语言模型(共14种配置)在比利时电网电力负荷预测任务中的表现,旨在揭示LLM在时序预测领域的能力边界。研究使用近10年的比利时电网数据,核心发现包括:Time-LLM(通过重编程层适配GPT-2的架构)表现优于传统XGBoost和LSTM;直接提示GPT-4o进行预测效果不佳;集成模型(XGB+LSTM+Time-LLM)取得最佳性能。
章节 02
电力负荷预测是能源行业核心问题,准确短期预测对电网调度、交易及可再生能源整合至关重要。传统方法包括统计模型(ARIMA、Prophet)和机器学习模型(XGBoost、LSTM),但LLM兴起后,需回答:这些文本模型能否直接应用于数值时序预测?本研究来自赫尔大学硕士项目,使用比利时电网2015-2025年超39.5万个15分钟间隔负荷数据,对比14种模型配置。
章节 03
数据来自比利时Elia公开门户,聚合为小时级后约9.9万条记录。预处理包括:线性插值填补0.19%缺失值;为XGBoost构造日历、滞后(t-1/t-24/t-168)及滚动统计特征;LSTM和Time-LLM用StandardScaler标准化(仅训练集拟合)。
章节 04
按时间划分70%训练/15%验证/15%测试,指标含MAE、RMSE、sMAPE、MASE。
| 模型 | MAE | MASE |
|---|---|---|
| 集成模型 | 263 | 0.49 |
| Time-LLM | 271 | 0.50 |
| XGBoost | 277 | 0.51 |
| GPT-4o零样本 | 481 | 0.89 |
| 模型 | MAE | MASE |
|---|---|---|
| 集成模型 | 299 | 0.55 |
| Time-LLM | 317 | 0.59 |
| XGBoost | 315 | 0.59 |
| GPT-4o零样本 | 535 | 0.99 |
章节 05
章节 06