正文

在Rockchip设备上部署Qwen-VL多模态模型：边缘AI视觉语言新方案

一个基于CMake的启动项目，展示如何在Rockchip RK3588等NPU设备上通过RKNN/RKLLM运行通义千问视觉语言模型，实现本地化的图像理解与文本生成

Qwen-VLRockchipRK3588RKNNRKLLM边缘AI多模态模型视觉语言模型CMake端侧部署

发布时间 2026/06/03 11:10最近活动 2026/06/03 11:20预计阅读 3 分钟

章节 01

【导读】在Rockchip设备部署Qwen-VL多模态模型：边缘AI视觉语言新方案

tristanpenman在GitHub发布的qwen-vl-rknn项目，是基于CMake的启动项目，展示如何在Rockchip RK3588等NPU设备上通过RKNN/RKLLM运行通义千问视觉语言模型（Qwen-VL），实现本地化图像理解与文本生成，为边缘AI多模态应用提供新方案。项目支持Linux和Android平台，具备模块化架构与容器化构建特性。

章节 02

项目背景：边缘AI多模态需求与Rockchip设备部署挑战

随着大型语言模型（LLM）和视觉语言模型（VLM）快速发展，边缘设备运行这些模型的需求增加，但云端部署存在延迟高、隐私风险大、网络依赖强等问题。Rockchip RK3588等NPU芯片具备强大AI加速能力，但主流多模态模型部署到这些设备是开发者面临的挑战，本项目正是为解决此问题而生。

章节 03

Qwen-VL模型家族简介

Qwen是阿里巴巴通义实验室开源的LLM家族，Qwen-VL是其扩展的视觉语言模型，输入支持图像、文本（有时视频），输出为文本，典型应用包括图像描述、OCR、UI解析等。模型演进路线：Qwen→Qwen-VL→Qwen2-VL→Qwen2.5-VL→Qwen3-VL。

章节 04

技术架构：双引擎设计与模块化项目结构

项目采用RKNN和RKLLM双引擎架构：RKLLM负责语言模型推理，RKNN负责视觉编码器加速，充分利用Rockchip NPU能力。项目结构清晰，包含cmake、cpp/src、scripts、thirdparty等目录，模块化设计便于扩展。

章节 05

支持的模型与硬件：RK3588设备及推荐模型版本

目标硬件为Rockchip RK3588芯片的Linux/Android设备（6 TOPS算力）。推荐入门模型Qwen2-VL-2B（20亿参数，约4.5GB，需16GB内存设备，下载地址：https://huggingface.co/3ib0n/Qwen2-VL-2B-rkllm）；进阶选择Qwen2-VL-7B（70亿参数，约9.6GB，下载地址：https://huggingface.co/3ib0n/Qwen2-VL-7B-rkllm）。

章节 06

构建与部署指南：跨平台构建步骤与配置

原生Linux构建可通过Docker命令：docker compose run --rm native ./scripts/build-native.sh Release；Android 14构建：docker compose run --rm android ./scripts/build-android.sh Release。支持自定义CMake配置，如RKNN/RKLLM路径、OpenCV版本及模块等。

章节 07

技术亮点与实际应用场景

技术亮点包括边缘端多模态推理（本地完成任务，隐私友好）、模块化架构、跨平台支持（Linux/Android）、容器化构建（可复现）。应用场景涵盖智能监控、工业质检、智能零售、文档处理、辅助设备等领域。

章节 08

局限性、未来展望与项目总结

局限性：受RK3588算力限制，目前支持2B/7B模型；量化导致精度损失；Rockchip AI生态仍在发展。未来展望：更大模型部署、更低延迟、更多模型支持、完善工具链。总结：项目为边缘AI多模态应用提供优秀起点，为开发者提供CMake构建、RKNN/RKLLM集成等参考，推动AI落地。

在Rockchip设备上部署Qwen-VL多模态模型：边缘AI视觉语言新方案

【导读】在Rockchip设备部署Qwen-VL多模态模型：边缘AI视觉语言新方案

项目背景：边缘AI多模态需求与Rockchip设备部署挑战

Qwen-VL模型家族简介

技术架构：双引擎设计与模块化项目结构

支持的模型与硬件：RK3588设备及推荐模型版本

构建与部署指南：跨平台构建步骤与配置

技术亮点与实际应用场景

局限性、未来展望与项目总结

继续阅读

Nornir MCP Server：将大语言模型引入网络自动化的企业级桥梁

Bibliothèque Française LLM：为大型语言模型优化的法语公版文献索引系统

Splinter：一款无锁零拷贝的共享内存 KV 与向量存储库，让 LLM 推理告别 socket 与 memcpy 开销

从零开始搭建AWS生成式AI应用：EC2+Bedrock实战教程