Verb Edge

Verb Edge é o tipo de Edge que expressa predicados/ações no fluxo GEUL. Classifica 13.767 verbos do WordNet em 10 Primitives → 68 Sub-primitives e gera um livro de códigos de 16 bits por codificação Huffman ao nível de Sub-primitive.

Documentos secundários

DocumentoDescrição
Papéis de participantes16 Semantic Roles (codificação de 4 bits)
Qualificadores semânticos14 qualificadores: evidencialidade, modo, tempo, aspecto, etc.

Hierarquia verbal

10 Primitive (categorias semânticas superiores)
 ├── BE          ├── PERCEIVE    ├── FEEL
 ├── THINK       ├── CHANGE      ├── CAUSE
 ├── MOVE        ├── COMMUNICATE ├── TRANSFER
 └── SOCIAL
  → 68 Sub-primitive (classificação intermediária)
    → 559 Root Verb (verbos raiz)
      → 13,767 Leaf Verb (todos os verbos do WordNet)

Tipos de pacotes de Verb Edge

Os 3 tipos de pacotes Tiny/Short/Full partilham os mesmos 16 bits de corpo verbal na última palavra.

TinyShortFull
Palavras2 (32bit)3 (48bit)5 (80bit)
Participantes16 padrões512 padrões19bit flags
Qualificadores7 padrões3.640 padrões27bit
Corpo verbal16bit16bit16bit
Proporção esperada90%7%3%

Tamanho médio do pacote: 0,9x2 + 0,07x3 + 0,03x5 = 2,16 palavras

Tiny Verb Edge (2 palavras)

1st WORD:  [Prefix 5bit] [Target×padrão 11bit]
2nd WORD:  [Corpo verbal 16bit]

Short Verb Edge (3 palavras)

1st WORD:  [Prefix 6bit] [Type 1bit=0] [Padrão participantes 9bit]
2nd WORD:  [Target×Padrão qualificadores 16bit]
3rd WORD:  [Corpo verbal 16bit]

Full Verb Edge (5 palavras)

1st WORD:  [Prefix 6bit] [Type 1bit=1] [Target participantes 5bit] [Flags participantes 4bit]
2nd+3rd:   [Flags participantes 15bit] [Qualificadores 17bit]
4th WORD:  [Qualificadores 10bit] [Reservado 6bit]
5th WORD:  [Corpo verbal 16bit]

Corpo verbal de 16 bits

┌─────────────────────────┬────────────────────────────┐
│   sub_primitive code    │     Índice DFS na árvore   │
│   (4-8 bits, Huffman)   │     (8-12 bits)            │
└─────────────────────────┴────────────────────────────┘

Distribuição de comprimento de códigos

ComprimentoQuantidadeVerbos totaisProporção
4 bits46.38846,4%
5 bits42.47918,0%
6 bits82.32116,9%
7 bits161.78613,0%
8 bits368135,9%

Cálculo de bits do DFS index

Verbos do sub_primitiveBits necessários
1~2568 bits
257~5129 bits
513~102410 bits
1025~204811 bits
2049~409612 bits

Exemplo: CHANGE-TRANSFORM = 0000(4 bits) + 3.063 verbos (12 bits) = 16 bits.

Comprimento médio de código

Média = Σ(comprimento de código × número de verbos) / total de verbos ≈ 5,14 bits
MétodoBits médios
Fixo 7 bits (68)7,00
Codificação Huffman5,14
Economia1,86 bits (27%)

Primitives - categorias principais (10)

PrimitiveSignificadoSub-primitivesVerbos
BEEstado/existência8899
PERCEIVEPercepção/cognição4218
FEELEmoção6204
THINKPensamento6769
CHANGEMudança83.358
CAUSECausação/ação143.739
MOVEMovimento62.182
COMMUNICATEComunicação6586
TRANSFERTransferência4530
SOCIALAção social6387

Sub-primitives de maior frequência (código de 4 bits)

Sub-primitiveCódigoVerbosProporçãoExemplo
CHANGE-TRANSFORM00003.06322,2%“mudar”, “tornar-se”
CAUSE-USE00011.3589,9%“usar”, “utilizar”
MOVE-DISPLACE00101.0257,4%“deslocar”
MOVE-GO00119426,8%“ir”

Os 4 Sub-primitives superiores representam 46,4% do total.

Filosofia de design

Razão para escolher codificação Huffman

Razão para eliminar os bits de Primitive

Manutenção do agrupamento semântico

A classificação por Primitives é mantida para a legibilidade humana e como dicas de agrupamento semântico durante o treino de LLMs.