正文

贝叶斯机器学习驱动的投资组合优化：当Black-Litterman遇上FinBERT与隐马尔可夫模型

探索如何将自然语言处理情感分析、市场状态识别与贝叶斯投资组合理论相结合，构建一个融合市场隐含先验与机器学习观点的智能资产配置系统。

贝叶斯机器学习Black-Litterman模型FinBERT隐马尔可夫模型投资组合优化情感分析量化金融

发布时间 2026/05/30 04:45最近活动 2026/05/30 04:48预计阅读 4 分钟

章节 01

导读 / 主楼：贝叶斯机器学习驱动的投资组合优化：当Black-Litterman遇上FinBERT与隐马尔可夫模型

探索如何将自然语言处理情感分析、市场状态识别与贝叶斯投资组合理论相结合，构建一个融合市场隐含先验与机器学习观点的智能资产配置系统。

章节 02

原作者与来源

原作者/维护者: Nomunbileg1 (Team "May the Code Be With You")
团队成员: Jenny Lee, Jack Morgan, Noah Tan, Ryusei Leon Nakano, Nomunbileg Sukhbold
来源平台: GitHub
原始标题: Bayesian_Final_Project_May_the_code_be_with_you
原始链接: https://github.com/Nomunbileg1/Bayesian_Final_Project_May_the_code_be_with_you
发布时间: 2026年5月29日

章节 03

项目背景与核心问题

传统均值-方差投资组合优化方法对预期收益率估计的噪声极为敏感，微小的输入误差可能导致输出权重的剧烈波动。Black-Litterman模型通过引入市场均衡收益作为先验分布，有效缓解了这一问题。然而，该模型的关键在于如何合理设定投资者观点——传统方法依赖人工主观判断，难以规模化应用。

本项目提出一个创新思路：利用机器学习自动生成投资者观点，并通过贝叶斯框架将其与市场先验进行融合。核心研究问题是：机器学习增强的贝叶斯投资组合优化能否通过协调市场先验与数据驱动的投资者观点来改善资产配置决策？

章节 04

技术架构概览

整个系统由三个核心组件构成，形成完整的贝叶斯机器学习流水线：

章节 05

1. 市场先验构建

基于市场均衡理论，通过逆优化方法从市值权重推导隐含预期收益：

Π = δ × Σ × w_mkt

其中Π为市场隐含预期收益，δ为风险厌恶系数，Σ为年化协方差矩阵，w_mkt为市值权重。项目选取了五只代表性股票：苹果(AAPL)、微软(MSFT)、特斯拉(TSLA)、台积电(TSM)和宝洁(PG)，覆盖科技成长与防御性消费板块。

章节 06

2. NLP情感观点生成

这是项目最具创新性的模块。团队微调了FinBERT模型——一个专门针对金融文本预训练的语言模型——使其适应Twitter金融文本的语言特征。

数据准备：

微调数据集：HuggingFace的Twitter Financial News Sentiment
推理数据集：Kaggle上2021-2022年爬取的股票相关推文
最终匹配到目标股票的推文：63,423条

模型改进： 微调后的FinBERT相比基础模型，准确率提升约14.82个百分点，宏平均F1分数提升约17.05个百分点。这一显著改进证明了领域自适应微调的价值。

观点生成机制： 每条推文被赋予情感分数score = P(positive) - P(negative)，范围在[-1, +1]之间。通过按股票代码和月份聚合，计算平均情感、标准差和提及量。最终转换为绝对观点（单只股票的预期收益）和相对观点（股票对之间的收益差异）。

章节 07

3. HMM市场状态建模

隐马尔可夫模型用于识别市场的潜在状态（如增长期、防御期、高波动期）。模型使用2018-2025年的历史对数收益训练，设定4个隐藏状态，经过47次迭代收敛。通过1000次蒙特卡洛模拟生成252个交易日的未来价格路径，从中估计预期收益和正向收益概率。

章节 08

情感分析结果

股票	预期收益	正向概率	置信度	提及量
TSM	3.11%	87.11%	74.21%	601
MSFT	1.63%	78.26%	56.51%	5,984
TSLA	1.34%	77.23%	54.47%	44,211
AAPL	1.16%	72.55%	45.10%	12,107
PG	0.36%	56.78%	13.55%	517

台积电(TSM)展现出最高的预期收益和置信度，而特斯拉(TSLA)虽然情感指标强劲，但项目团队注意到一个关键现象：在2022年熊市期间，特斯拉股价大幅下跌，但推文情感依然保持积极，显示出散户投资者的乐观偏见。这正是Black-Litterman框架的价值所在——它可以纳入情感观点，但不会让其完全主导投资组合，因为每个观点都被赋予了不确定性度量。