章节 01
【主楼】多模态大模型OCR优化实战:LoRA、GRPO与ICL协同应用
核心观点:基于Qwen3-VL-4B的多模态大模型OCR优化方案,结合LoRA微调、GRPO强化学习和上下文学习(ICL)技术,在多个公开数据集上实现下游OCR任务性能提升。项目支持多基座模型,提供完整的训练到推理流程,可作为毕设框架或研究基础。
原作者与来源
- 原作者/维护者: akjncjancj
- 来源平台: GitHub
- 原始标题: bishe-sft
- 原始链接: https://github.com/akjncjancj/bishe-sft
- 发布时间: 2026年6月12日