SILK — Символический индекс для знаний LLM
Нейро-символическая поисковая архитектура на 64-битных целых числах. Поиск по 100 миллионам сущностей Wikidata менее чем за секунду в 1,3 ГБ памяти — без векторной БД, ANN-графа или модели эмбеддингов.
Нейро-символическая поисковая архитектура на 64-битных целых числах. Поиск по 100 миллионам сущностей Wikidata менее чем за секунду в 1,3 ГБ памяти — без векторной БД, ANN-графа или модели эмбеддингов.
GEUL не отвергает Викиданные. Он преобразует систему классификации и статистику частотности 100 миллионов сущностей в кодовые книги SIDX. Грамматика строится поверх словаря.
Когда смысл выгравирован в битах, поиск становится рассуждением
Фиксированный 4-словный (64-бит) Node для идентификации сущностей: людей, мест, объектов и организаций. 3-бит Mode для квантификации/числа, 6-бит EntityType для 64 верхних типов, 48-бит Attributes для семантических свойств каждого типа.
Спецификация бинарного потокового формата на основе SIDX — 64-битного глобального семантического идентификатора. Принципы проектирования, система Prefix, 9 типов пакетов и правила кодирования.