動詞エッジ
13,767個のWordNet動詞を10個のPrimitive → 68個のSub-primitiveに分類し、ハフマン符号化で16ビットコードブックを生成する。Tiny(2ワード)/Short(3ワード)/Full(5ワード)の3種パケットで平均2.16ワード圧縮を達成する。
64ビットSIDXベースの意味整列バイナリストリームフォーマットのパケットタイプとエンコーディングルール
13,767個のWordNet動詞を10個のPrimitive → 68個のSub-primitiveに分類し、ハフマン符号化で16ビットコードブックを生成する。Tiny(2ワード)/Short(3ワード)/Full(5ワード)の3種パケットで平均2.16ワード圧縮を達成する。
人物・場所・事物・組織などの個体を識別する固定長4ワード(64ビット)Node。3ビットModeで量化/数を表現し、6ビットEntityTypeで64種の上位タイプを分類し、48ビットAttributesでタイプ別意味属性をエンコードする。
(Subject, Property, Object)形式の関係と属性を表現するEdgeタイプ。基本モード4ワードと拡張モード5ワードの二重構造でTop 63高頻度属性を最適化する。
述語、イベント、関係間の論理的・談話的関係を表現する4ワード固定Edge。RSTベースの16種の関係タイプで因果、時間、対比、論証関係をエンコードする。
六何原則(Who, What, Whom, When, Where, Why)を一度に表現する可変長イベントEdge。Presenceビットマスクで3~8ワードの可変構造を実現する。
「どの世界観/文脈でこの主張が真か」を表現する3ワード軽量Edge。出典、世界観、虚構、視点など64タイプで真理の条件をエンコードする。
物理量、数値、通貨、リテラル等を表現する可変長4~7ワードNode。6ビットUnitでSI基本/誘導単位・通貨・特殊リテラルをエンコードし、4ビットScaleでSI接頭辞を表現する。
プログラミング言語のASTをGEULグラフで表現するEdgeタイプ。6ビットで64言語を分類し、8ビットで256種のASTノードタイプをエンコードする。PathGEULクエリ言語を含む。
複数のNodeをAND、OR、LIST、SETなど7種のタイプでまとめる可変長Edge。13ビットPrefixと終結マーカー(0x0000)方式で無制限メンバーをサポートする。
GEULストリームはMeta Nodeで始まり終わるパケットシーケンスである。TIDスコーピング、順方向参照、パケット順序規則を定義する。