SILK — LLM知识的符号索引
用64位整数检索的神经符号搜索架构。无需向量数据库、ANN图或嵌入模型,亚秒级检索维基数据1亿实体。
用64位整数检索的神经符号搜索架构。无需向量数据库、ANN图或嵌入模型,亚秒级检索维基数据1亿实体。
GEUL不否定维基数据,而是将1亿个实体的分类体系和频率统计转化为SIDX码本。在词典之上构建语法。
当意义被刻入比特,搜索就变成了推理
用于识别人物、地点、事物、组织等实体的固定长度4字(64位)Node。3位Mode表达量化/数,6位EntityType分类64种上位类型,48位Attributes编码各类型的语义属性。
基于SIDX 64位全局语义标识符的二进制流格式规范。定义设计原则、Prefix体系、9种数据包类型及编码规则。