Zing 论坛

正文

AuraDent:实时语音驱动的牙科临床文档自动化平台

AuraDent 是一个面向牙科诊所的实时文档平台,通过 Deepgram 语音识别、AI 智能提取和 AWS 异步处理,将医生椅旁口述自动转化为结构化病历、治疗图表和术后指导。

医疗AI语音识别临床文档牙科DeepgramAWS LambdaPII脱敏
发布时间 2026/04/27 06:44最近活动 2026/04/27 07:23预计阅读 2 分钟
AuraDent:实时语音驱动的牙科临床文档自动化平台
1

章节 01

导读 / 主楼:AuraDent:实时语音驱动的牙科临床文档自动化平台

AuraDent 是一个面向牙科诊所的实时文档平台,通过 Deepgram 语音识别、AI 智能提取和 AWS 异步处理,将医生椅旁口述自动转化为结构化病历、治疗图表和术后指导。

2

章节 02

临床文档的痛点与机遇

牙科诊疗过程中,医生需要在治疗患者的同时记录病历、更新治疗图表、撰写术后指导——这些文档工作既耗时又容易出错。传统的做法是治疗后回忆填写,信息准确性和完整性都难以保证。AuraDent 的诞生正是为了解决这一行业痛点:让医生专注于治疗,让 AI 处理文档。

3

章节 03

系统架构概览

AuraDent 采用 TypeScript 单体仓库架构,将实时语音处理、AI 智能提取和异步后处理有机结合。整个系统分为五个核心模块:

4

章节 04

实时网关(Gateway)

基于 Fastify 和 WebSocket 构建的实时网关是系统的入口。它接收来自浏览器的前端音频流,将其转发给 Deepgram 进行语音识别。网关负责管理会话生命周期,区分暂定转录(partial)和最终转录(final),并在将内容发送给 AI 之前执行 PII(个人身份信息)脱敏处理。

5

章节 05

智能代理核心(Agent Core)

这是系统的"大脑",基于 Vercel AI SDK 构建。代理接收脱敏后的转录文本,通过类型化的工具调用(typed tools)和 Zod 验证,提取结构化的临床发现。例如,当医生说 "患者右下第二磨牙需要根管治疗",代理会识别出牙位(#31)、诊断(需要根管治疗)并更新相应的数据结构。

6

章节 06

环境前端(Web)

React + Vite 构建的临床终端界面,为医生提供实时反馈。界面包含:

  • 波形可视化:显示麦克风活动状态
  • 转录区域:展示暂定和最终转录文本
  • 治疗图表:动画式更新牙齿状态
  • 追踪视图:显示代理的思考过程、工具调用和完成事件
7

章节 07

归一化层(Ingestion)

负责将代理提取的原始结构化数据转换为适合持久化的记录格式,包括去重逻辑(同一牙齿的多次提及合并)和来源追溯(记录每条发现对应的语音片段)。

8

章节 08

异步工作器(Worker)

基于 AWS Lambda 的后处理模块。当会话结束时,网关将会话数据(脱敏转录、结构化发现、追踪记录、性能指标)发送到 SQS 队列,触发工作器生成术后 PDF 指导、模拟保险预授权,并将完整记录写入 PostgreSQL。