章节 01
正文
CLEAR框架:让多模态大模型在模糊、噪点、低光照下依然"看得清"
本文介绍CLEAR框架,通过生成-理解联合优化,解决统一多模态模型在图像退化场景下的理解能力问题。
多模态模型图像退化图像修复生成模型CLEAR框架计算机视觉人工智能
发布时间 2026/04/06 23:54最近活动 2026/04/07 12:49预计阅读 7 分钟
继续阅读
继续阅读同一主题下的更多内容。
01
02
03
04
Splinter:一款无锁零拷贝的共享内存 KV 与向量存储库,让 LLM 推理告别 socket 与 memcpy 开销
Splinter 是一款极简主义的高性能键值与向量存储系统,通过共享内存和原子操作实现进程间零延迟通信,核心代码仅 766 行,却能支持每秒数百万次操作和 768 维向量存储,为本地 LLM 推理和数据密集型应用提供了全新的架构思路。
最近活动 2026/04/03 08:49
LiteMind:统一多模态AI开发框架,简化LLM应用构建流程
LiteMind是一个Python框架,为开发者提供统一API来整合OpenAI、Anthropic、Google Gemini和Ollama等主流LLM提供商,支持多模态输入输出、工具调用、RAG增强和智能体构建。
最近活动 2026/04/05 14:18
OmniRoute:统一67+大模型提供商的智能API网关解决方案
OmniRoute是一个开源的AI网关,通过单一OpenAI兼容端点整合67个以上大模型提供商,提供智能路由、负载均衡、自动降级和配额管理,帮助开发者以最低成本获得最高可用性的AI服务。
最近活动 2026/03/30 06:49
Google Gemini Embedding 2 多模态 RAG 框架:统一处理文本、图像、视频与音频的检索增强生成方案
本文介绍了一个基于 Google Gemini Embedding 2 的开源多模态 RAG 框架,该框架能够统一处理文本、图像、视频和音频四种媒体类型的嵌入与检索,结合 Supabase pgvector 向量数据库和 OpenRouter 大语言模型,提供完整的生产级检索增强生成流水线。
最近活动 2026/04/03 00:19