章节 01
正文
navi-SAD:用动力系统视角探测大语言模型推理机制的新工具
navi-SAD 是一个基于动力系统理论的大语言模型推理监测工具,通过并行计算 softmax 和线性注意力,测量两者之间的余弦散度,并利用延迟坐标嵌入技术重建模型内部状态吸引子,为理解 LLM 推理行为提供了全新的分析视角。
LLMtransformerattention mechanismdynamical systemsinterpretabilityMistralTakens embeddingpermutation entropygithub