동사 엣지
13,767개 WordNet 동사를 10개 Primitive → 68개 Sub-primitive로 분류하고 허프만 코딩으로 16비트 코드북을 생성한다. Tiny(2워드)/Short(3워드)/Full(5워드) 3가지 패킷으로 평균 2.16워드 압축을 달성한다.
13,767개 WordNet 동사를 10개 Primitive → 68개 Sub-primitive로 분류하고 허프만 코딩으로 16비트 코드북을 생성한다. Tiny(2워드)/Short(3워드)/Full(5워드) 3가지 패킷으로 평균 2.16워드 압축을 달성한다.
사건 내부의 의미적 역할을 정의하는 16개 Participant. 4비트 인코딩으로 Agent, Theme, Recipient 등 핵심 역할부터 Cause, Purpose 등 부가 역할까지 표현한다.
사람·장소·사물·조직 등 개체를 식별하는 고정 길이 4워드(64비트) Node. 3비트 Mode로 양화/수를 표현하고, 6비트 EntityType으로 64개 상위 타입을 분류하며, 48비트 Attributes로 타입별 의미 속성을 인코딩한다.
Verb Edge의 의미 한정자. 증거성·서법·양태·시제·상·공손·긍부정·의도성·확신성·반복성 등 14개 범주로 서술의 문법적·화용적 정보를 인코딩한다.
(Subject, Property, Object) 형태의 관계와 속성을 표현하는 Edge 타입. 기본 모드 4워드와 확장 모드 5워드의 이중 구조로 Top 63 고빈도 속성을 최적화한다.
서술, 사건, 관계 간의 논리적·담화적 관계를 표현하는 4워드 고정 Edge. RST 기반 16개 관계 타입으로 인과, 시간, 대조, 논증 관계를 인코딩한다.
6하원칙(Who, What, Whom, When, Where, Why)을 한 번에 표현하는 가변 길이 사건 Edge. Presence 비트마스크로 3~8워드 가변 구조를 실현한다.
'어느 세계관/맥락에서 이 주장이 참인가'를 표현하는 3워드 경량 Edge. 출처, 세계관, 허구, 시점 등 64개 타입으로 진리의 조건을 인코딩한다.
물리량, 수치, 화폐, 리터럴 등을 표현하는 가변 길이 4~7워드 Node. 6비트 Unit으로 SI 기본/유도 단위·통화·특수 리터럴을 인코딩하고, 4비트 Scale로 SI 접두어를 표현한다.
프로그래밍 언어의 AST를 GEUL 그래프로 표현하는 Edge 타입. 6비트로 64개 언어를 분류하고, 8비트로 256개 AST 노드 타입을 인코딩한다. PathGEUL 쿼리 언어를 포함한다.
복수의 Node를 AND, OR, LIST, SET 등 7가지 타입으로 묶는 가변 길이 Edge. 13비트 Prefix와 종결 마커(0x0000) 방식으로 무제한 멤버를 지원한다.
GEUL 스트림은 Meta Node로 시작하고 끝나는 패킷 시퀀스이다. TID 스코핑, 순방향 참조, 패킷 순서 규칙을 정의한다.
SIDX 64비트 전역 의미 식별자 기반의 바이너리 스트림 포맷 명세. 설계 원칙, Prefix 체계, 9종 패킷 타입, 인코딩 규칙을 정의한다.