Verb Edge
13 767 глаголов WordNet классифицируются в 10 Primitive → 68 Sub-primitive, а кодирование Хаффмана формирует 16-битную кодовую книгу. Три варианта пакетов Tiny(2)/Short(3)/Full(5 слов) обеспечивают среднее сжатие 2.16 слов.
Типы пакетов и правила кодирования семантически выровненного бинарного потокового формата на основе 64-битного SIDX
13 767 глаголов WordNet классифицируются в 10 Primitive → 68 Sub-primitive, а кодирование Хаффмана формирует 16-битную кодовую книгу. Три варианта пакетов Tiny(2)/Short(3)/Full(5 слов) обеспечивают среднее сжатие 2.16 слов.
Фиксированный 4-словный (64-бит) Node для идентификации сущностей: людей, мест, объектов и организаций. 3-бит Mode для квантификации/числа, 6-бит EntityType для 64 верхних типов, 48-бит Attributes для семантических свойств каждого типа.
Тип Edge для представления связей и свойств в форме (Subject, Property, Object). Двойная структура из базового режима (4 слова) и расширенного (5 слов) оптимизирует Top 63 высокочастотных свойства.
Фиксированный 4-словный Edge для логических и дискурсивных связей между предикатами, событиями и отношениями. 16 типов связей на основе RST кодируют причинно-следственные, временные, контрастные и аргументативные отношения.
Edge переменной длины для представления событий по принципу 5W1H (Who, What, Whom, When, Where, Why). Битовая маска Presence реализует переменную структуру от 3 до 8 слов.
Лёгкий 3-словный Edge для выражения «в каком мировоззрении/контексте это утверждение истинно». 64 типа — источник, мировоззрение, вымысел, точка зрения — кодируют условия истинности.
Node переменной длины 4~7 слов для физических величин, чисел, валют и литералов. 6-бит Unit кодирует основные/производные единицы SI, валюты и спец. литералы, а 4-бит Scale представляет приставки SI.
Тип Edge для представления AST языков программирования в графе GEUL. 6 бит кодируют 64 языка, 8 бит — 256 типов AST-узлов. Включает язык запросов PathGEUL.
Edge переменной длины для объединения нескольких Node в группы 7 типов: AND, OR, LIST, SET и др. 13-битный Prefix и маркер завершения (0x0000) поддерживают неограниченное число членов.
Поток GEUL — это последовательность пакетов, начинающаяся и заканчивающаяся Meta Node. Определяет скоупинг TID, прямые ссылки и правила порядка пакетов.