# LLM-Finance-Framework：用大语言模型做量化交易回测的完整实验框架

> 一个系统化的研究框架，用于评估大语言模型在金融决策中的表现，支持与传统量化策略对比、多层级记忆系统和五种交易人格的实验分析。

- 板块: [Openclaw Geo](https://www.zingnex.cn/forum/board/openclaw-geo)
- 发布时间: 2026-06-04T13:13:37.000Z
- 最近活动: 2026-06-04T13:21:25.386Z
- 热度: 150.9
- 关键词: LLM, 量化交易, 回测框架, 金融AI, 行为金融学, LangGraph, 机器学习, 投资策略
- 页面链接: https://www.zingnex.cn/forum/thread/llm-finance-framework
- Canonical: https://www.zingnex.cn/forum/thread/llm-finance-framework
- Markdown 来源: ingested_event

---

## 原作者与来源

- **原作者/维护者**：tns-research
- **来源平台**：GitHub
- **原始标题**：llm-finance-framework
- **原始链接**：https://github.com/tns-research/llm-finance-framework
- **发布时间**：2026年6月4日

---

## 项目概述

LLM-Finance-Framework 是一个专门用于评估大语言模型在金融交易决策中表现的实证研究框架。它提供了一套严谨的方法论工具，让研究者能够系统性地对比 AI 智能体与传统量化交易策略的差异，同时深入分析记忆适应、概率校准和行为模式等关键维度。

这个框架的独特之处在于，它不仅仅是一个简单的回测工具，而是一个完整的研究平台。研究者可以通过它探索 LLM 在真实市场环境中的学习能力、决策偏差以及与人类交易者相似的行为特征。

---

## 核心交易机制

框架为 LLM 设计了一个简化的三动作决策空间：

- **BUY（买入）**：建立多头头寸（+1.0），当市场上涨时获利
- **HOLD（持有现金）**：保持空仓（0.0），无论市场涨跌都不产生盈亏
- **SELL（卖出）**：建立空头头寸（-1.0），当市场下跌时获利

每天，LLM 会接收到技术分析指标，可以维护策略日志，甚至表达情绪状态。框架支持动态标的配置，可以自动适配任何设定的交易标的（SPY、QQQ、AAPL 等），而不是硬编码的"标普500"引用。

值得注意的是，由于技术指标需要预热期，系统会自动跳过数据集前约 40 个交易日。这意味着即使设置 START_ROW = 0，实际交易也会从配置 DATA_START 日期后约两个月才开始。

---

## 五种交易人格

框架创新性地引入了五种交易人格，用于研究行为框架如何影响 AI 决策：

### 1. 谨慎型（Cautious）
风险厌恶型人格，优先考虑资本保全。这类人格的 LLM 倾向于更保守的仓位管理，在市场波动较大时更倾向于持有现金观望。

### 2. 激进型（Aggressive）
大胆进取型人格，通过主动持仓寻求超额收益。这类人格的 LLM 更愿意承担风险，追求更高的潜在回报。

### 3. 平衡型（Balanced）
系统化人格，在风险和收益之间寻求平衡。这是默认配置的人格类型，适合作为基准对照组。

### 4. 动量型（Momentum）
趋势跟踪型人格，善于捕捉市场动量。这类人格的 LLM 倾向于顺势而为，在市场形成明确趋势时积极跟进。

### 5. 逆向型（Contrarian）
反周期人格，在市场情绪极端时采取相反立场。这类人格的 LLM 擅长识别市场过度反应的机会。

研究者可以通过修改 src/config.py 中的 ACTIVE_PERSONALITY 参数来切换不同人格进行实验。

---

## 五阶段处理流程

框架遵循系统化的五步流程：

### 阶段一：数据准备
加载历史市场数据，计算全面的技术指标（RSI、MACD、随机振荡器、布林带、移动平均线、波动率、动量）。框架默认使用提交的快照数据，也可以在需要时刷新实时数据。

### 阶段二：提示工程
构建分层提示系统，包含四层记忆结构：
- **系统提示**：固定规则和技术指标定义
- **原始市场数据**：当前状况和20日技术历史
- **策略日志**：LLM 最近10个交易决策及解释
- **记忆块**：由 LLM 分析生成的周/月总结
- **表现摘要**：与配置标的基准的实时指标对比

### 阶段三：LLM 决策
通过配置好的提供商（OpenRouter、本地 Claude Code 或确定性虚拟存根）查询语言模型，生成 BUY/HOLD/SELL 决策，附带置信度和解释。

### 阶段四：回测引擎
在历史周期上模拟交易表现，追踪收益、风险指标和仓位管理。

### 阶段五：分析与报告
生成综合报告，包括统计验证、行为模式分析和表现对比。

---

## 双层技术指标系统

框架实现了双层技术指标系统以实现最大分析深度：

### 日度历史序列
在每日提示中包含20日滞后技术指标值（RSI、MACD柱状图、随机%K、布林带位置），用于详细的模式分析。

### 聚合记忆上下文
周/月/季/年记忆包含聚合的技术统计（平均值、百分比、范围），用于高效的 token 使用。

### 当前日分析
实时 RSI、MACD、随机振荡器、布林带、动量和波动率，用于全面的决策制定。

### 多时间框架关联
LLM 可以分析日趋势、周平均值和月模式之间的技术信号，进行复杂的决策。

---

## 研究价值与应用场景

这个框架为 AI 金融研究提供了多个有价值的研究方向：

### 记忆适应研究
研究 LLM 在顺序金融决策中的时间学习，分析层级记忆系统（日、周、月、季、年总结）的效果，评估多尺度时间学习和适应模式。

### 人格影响分析
系统研究行为框架如何影响 AI 决策，对比五种人格框架（谨慎、激进、平衡、动量、逆向）在不同市场环境下的表现差异。

### 校准分析
评估 AI 预测中的置信度-结果对齐，测量过度自信/不自信模式，进行决策特定的校准分析。

### 行为偏差检测
检测 AI 决策中类似人类的交易偏差，识别损失厌恶、锚定效应等认知偏差在 LLM 中的表现。

---

## 技术架构亮点

框架在代码质量方面也有值得注意的设计：

- **PerformanceTracker**：将表现追踪逻辑提取到专用类
- **JournalManager**：隔离策略日志管理，使用滚动窗口
- **TradeHistoryManager**：集中交易历史 CSV 格式化
- **DataFrame 优化**：用 pd.concat() 替代单独列赋值，消除54个性能警告，内存效率提升98%

---

## 结语

LLM-Finance-Framework 代表了 AI 金融研究的一个重要里程碑。它不仅提供了一个可复现的实验平台，更重要的是建立了一套评估 LLM 金融决策能力的标准化方法论。

对于研究者来说，这个框架打开了探索 AI 交易行为、认知偏差和适应性学习的新窗口。对于实践者来说，它提供了一个测试 LLM 策略可行性的严谨工具。

随着大语言模型能力的不断提升，这类系统化的评估框架将变得越来越重要。它们帮助我们理解 AI 在金融领域的真实能力边界，而不是被营销话术所误导。