章节 01
导读 / 主楼:贝叶斯机器学习驱动的投资组合优化:当Black-Litterman遇上FinBERT与隐马尔可夫模型
探索如何将自然语言处理情感分析、市场状态识别与贝叶斯投资组合理论相结合,构建一个融合市场隐含先验与机器学习观点的智能资产配置系统。
正文
探索如何将自然语言处理情感分析、市场状态识别与贝叶斯投资组合理论相结合,构建一个融合市场隐含先验与机器学习观点的智能资产配置系统。
章节 01
探索如何将自然语言处理情感分析、市场状态识别与贝叶斯投资组合理论相结合,构建一个融合市场隐含先验与机器学习观点的智能资产配置系统。
章节 02
章节 03
传统均值-方差投资组合优化方法对预期收益率估计的噪声极为敏感,微小的输入误差可能导致输出权重的剧烈波动。Black-Litterman模型通过引入市场均衡收益作为先验分布,有效缓解了这一问题。然而,该模型的关键在于如何合理设定投资者观点——传统方法依赖人工主观判断,难以规模化应用。
本项目提出一个创新思路:利用机器学习自动生成投资者观点,并通过贝叶斯框架将其与市场先验进行融合。核心研究问题是:机器学习增强的贝叶斯投资组合优化能否通过协调市场先验与数据驱动的投资者观点来改善资产配置决策?
章节 04
整个系统由三个核心组件构成,形成完整的贝叶斯机器学习流水线:
章节 05
基于市场均衡理论,通过逆优化方法从市值权重推导隐含预期收益:
Π = δ × Σ × w_mkt
其中Π为市场隐含预期收益,δ为风险厌恶系数,Σ为年化协方差矩阵,w_mkt为市值权重。项目选取了五只代表性股票:苹果(AAPL)、微软(MSFT)、特斯拉(TSLA)、台积电(TSM)和宝洁(PG),覆盖科技成长与防御性消费板块。
章节 06
这是项目最具创新性的模块。团队微调了FinBERT模型——一个专门针对金融文本预训练的语言模型——使其适应Twitter金融文本的语言特征。
数据准备:
模型改进: 微调后的FinBERT相比基础模型,准确率提升约14.82个百分点,宏平均F1分数提升约17.05个百分点。这一显著改进证明了领域自适应微调的价值。
观点生成机制:
每条推文被赋予情感分数score = P(positive) - P(negative),范围在[-1, +1]之间。通过按股票代码和月份聚合,计算平均情感、标准差和提及量。最终转换为绝对观点(单只股票的预期收益)和相对观点(股票对之间的收益差异)。
章节 07
隐马尔可夫模型用于识别市场的潜在状态(如增长期、防御期、高波动期)。模型使用2018-2025年的历史对数收益训练,设定4个隐藏状态,经过47次迭代收敛。通过1000次蒙特卡洛模拟生成252个交易日的未来价格路径,从中估计预期收益和正向收益概率。
章节 08
| 股票 | 预期收益 | 正向概率 | 置信度 | 提及量 |
|---|---|---|---|---|
| TSM | 3.11% | 87.11% | 74.21% | 601 |
| MSFT | 1.63% | 78.26% | 56.51% | 5,984 |
| TSLA | 1.34% | 77.23% | 54.47% | 44,211 |
| AAPL | 1.16% | 72.55% | 45.10% | 12,107 |
| PG | 0.36% | 56.78% | 13.55% | 517 |
台积电(TSM)展现出最高的预期收益和置信度,而特斯拉(TSLA)虽然情感指标强劲,但项目团队注意到一个关键现象:在2022年熊市期间,特斯拉股价大幅下跌,但推文情感依然保持积极,显示出散户投资者的乐观偏见。这正是Black-Litterman框架的价值所在——它可以纳入情感观点,但不会让其完全主导投资组合,因为每个观点都被赋予了不确定性度量。