Zing 论坛

正文

gaze-model:基于多模态粒子滤波器的千赫兹二维视线追踪技术

一种利用扫描检眼镜和粒子滤波技术实现高速二维视线重建的开源研究项目,解决了传统单假设追踪器在高采样率下的空间混叠问题。

gaze trackingparticle filterophthalmoscopeeye trackingcomputer visionsignal processingneuroscience
发布时间 2026/06/12 07:55最近活动 2026/06/12 08:21预计阅读 2 分钟
gaze-model:基于多模态粒子滤波器的千赫兹二维视线追踪技术
1

章节 01

gaze-model:基于多模态粒子滤波器的千赫兹二维视线追踪技术导读

gaze-model是一个开源研究项目,利用扫描检眼镜和多模态粒子滤波技术实现千赫兹级别的二维视线重建,解决了传统单假设追踪器在高采样率下的空间混叠问题,可应用于眼科诊断、神经科学研究和人机交互等领域。

2

章节 02

研究背景:高采样率视线追踪的技术挑战

视线追踪技术在眼科诊断、神经科学研究和人机交互领域应用广泛。传统方法基于单假设模型(如卡尔曼滤波器),高采样率下易受空间混叠影响导致精度下降。扫描检眼镜能高速采集眼部图像,为千赫兹追踪提供数据基础,但如何从高速扫描数据提取准确视线位置仍是挑战。

3

章节 03

核心技术创新与组件架构

多模态粒子滤波器

项目采用创新的多模态粒子滤波器方法,通过分析-合成框架实现:

  1. 粒子渲染:每个粒子从最近帧渲染扫描线
  2. 眼动先验:传播粒子云
  3. 二维配准:外观信息不足时重新锚定估计

技术组件架构

模块 功能描述
filter.py 多模态粒子滤波器(预测/权重/估计/重采样)
dynamics.py 交互多模型先验(追踪扫视 + 扫视主序列)
decoder.py 冻结可微分线条渲染器(atlas ↔ 线条)
likelihood.py 物理外观似然(别名感知分数)
khz2d_methods.py M0–M5 候选方法和基准测试框架
losses.py, train.py 自监督损失 + 可选学习似然
4

章节 04

实验框架与结果

项目包含完整实验框架:

  • docs/make_figures.py:重新生成文档图表
  • results/:包含每个注视点的报告和图表
  • 基准测试框架支持M0到M5多种候选方法的比较
5

章节 05

项目状态与局限

当前状态

项目处于研究预印本阶段,真实数据数字通过自洽性和独立追踪器一致性验证(必要但不充分),绝对精度验证需人工眼完成(未来方向)。

数据说明

原始采集数据、每人atlas、缓存和结果视频未包含在仓库(见.gitignore),仓库仅含源代码、项目页面和轻量级结果摘要/图表。

6

章节 06

应用价值与未来展望

实际应用价值

  • 眼科诊断:捕捉微扫视等细微眼动,提供精确眼动指标,支持精细视觉评估
  • 神经科学:研究眼动与认知关联,分析阅读注视模式,探索注意力分配
  • 人机交互:超低延迟视线交互,自然界面控制,辅助技术视线输入

技术启示与展望

项目展示经典信号处理(粒子滤波)与眼科成像结合的潜力,开源提供可复现基础、方法比较基准和扩展可能性。完成绝对精度验证后,有望应用于临床眼科和高端人机交互系统。