结构导向检索
结构导向检索,是一种根据材料在知识结构中的位置和作用来检索内容的方法,而不是只依赖文本相似度。
结构导向检索,是一种根据材料在知识结构中的位置和作用来检索内容的方法,而不是只依赖文本相似度。
大多数检索增强系统从相似度开始。它们寻找和用户问题在文字或语义向量上相似的段落。相似度有用,但对专家知识来说并不充分。一个段落可能在文字上很相似,却在结构上无关。另一个段落可能文字上不那么接近,却因为定义了问题所需的概念、方法或理论而非常关键。
SonaMinds 用结构导向检索来处理这个问题。系统应该先理解问题在知识架构中的位置,再根据这个位置检索材料。如果问题询问方法,方法类材料应该优先。如果问题询问理论框架,和该框架相关的定义材料和案例材料应该被调出。如果问题涉及核心概念,定义和稳定该概念的材料就应该指导回答。
按照结构角色检索
在一个结构化专家体系中,材料并不扮演同一种角色。有些材料定义概念,有些材料解释理论,有些材料说明案例,有些材料提供事实依据,有些材料规定操作方法,有些材料展示专家如何把方法应用到新问题上。结构导向检索就是让这些角色进入检索过程。
这种方式可以减少上下文噪音。SonaMinds 不追求把尽可能多的材料塞进模型上下文,而是优先寻找结构上相关的材料。更小但更准确的上下文,常常比大量松散材料更有利于生成稳定答案。
和普通 RAG 的区别
普通 RAG 往往是从问题到相似片段,再到回答。结构导向检索在问题和检索之间加入一个结构判断步骤。系统先问这是什么类型的问题,激活了哪个知识层级,涉及哪些概念或方法,应该检索什么角色的材料,然后再执行检索。
这并不是取消语义检索,而是重新组织语义检索。相似度仍然有用,但应该在结构定义的范围内使用。
例子
如果用户问一个哲学框架能否解释某个 AI 现象,单纯相似度系统可能只检索提到 AI 的段落。结构导向系统还会检索概念定义、理论陈述和方法笔记,因为这些材料说明这个框架如何推理。