Verb Edge

Verb Edge es el tipo de Edge que expresa predicados/acciones en el flujo GEUL. Clasifica 13,767 verbos de WordNet en 10 Primitives → 68 Sub-primitives y genera un libro de códigos de 16 bits mediante codificación Huffman a nivel de Sub-primitive.

Documentos secundarios

DocumentoDescripción
Roles de participantes16 Semantic Roles (codificación de 4 bits)
Calificadores semánticos14 calificadores: evidencialidad, modo, tiempo, aspecto, etc.

Jerarquía verbal

10 Primitive (categorías semánticas superiores)
 ├── BE          ├── PERCEIVE    ├── FEEL
 ├── THINK       ├── CHANGE      ├── CAUSE
 ├── MOVE        ├── COMMUNICATE ├── TRANSFER
 └── SOCIAL
  → 68 Sub-primitive (clasificación intermedia)
    → 559 Root Verb (verbos raíz)
      → 13,767 Leaf Verb (todos los verbos de WordNet)

Tipos de paquetes de Verb Edge

Los 3 tipos de paquetes Tiny/Short/Full comparten los mismos 16 bits de cuerpo verbal en la última palabra.

TinyShortFull
Palabras2 (32bit)3 (48bit)5 (80bit)
Participantes16 patrones512 patrones19bit flags
Calificadores7 patrones3,640 patrones27bit
Cuerpo verbal16bit16bit16bit
Proporción esperada90%7%3%

Tamaño promedio de paquete: 0.9x2 + 0.07x3 + 0.03x5 = 2.16 palabras

Tiny Verb Edge (2 palabras)

1st WORD:  [Prefix 5bit] [Target×patrón 11bit]
2nd WORD:  [Cuerpo verbal 16bit]

Short Verb Edge (3 palabras)

1st WORD:  [Prefix 6bit] [Type 1bit=0] [Patrón participantes 9bit]
2nd WORD:  [Target×Patrón calificadores 16bit]
3rd WORD:  [Cuerpo verbal 16bit]

Full Verb Edge (5 palabras)

1st WORD:  [Prefix 6bit] [Type 1bit=1] [Target participantes 5bit] [Flags participantes 4bit]
2nd+3rd:   [Flags participantes 15bit] [Calificadores 17bit]
4th WORD:  [Calificadores 10bit] [Reservado 6bit]
5th WORD:  [Cuerpo verbal 16bit]

Cuerpo verbal de 16 bits

┌─────────────────────────┬────────────────────────────┐
│   sub_primitive code    │     Índice DFS en árbol    │
│   (4-8 bits, Huffman)   │     (8-12 bits)            │
└─────────────────────────┴────────────────────────────┘

Distribución de longitud de códigos

LongitudCantidadVerbos totalesProporción
4 bits46,38846.4%
5 bits42,47918.0%
6 bits82,32116.9%
7 bits161,78613.0%
8 bits368135.9%

Cálculo de bits del DFS index

Verbos del sub_primitiveBits necesarios
1~2568 bits
257~5129 bits
513~102410 bits
1025~204811 bits
2049~409612 bits

Ejemplo: CHANGE-TRANSFORM = 0000(4 bits) + 3,063 verbos (12 bits) = 16 bits.

Longitud promedio de código

Promedio = Σ(longitud de código × número de verbos) / total de verbos ≈ 5.14 bits
MétodoBits promedio
Fijo 7 bits (68)7.00
Codificación Huffman5.14
Ahorro1.86 bits (27%)

Primitives - categorías principales (10)

PrimitiveSignificadoSub-primitivesVerbos
BEEstado/existencia8899
PERCEIVEPercepción/cognición4218
FEELEmoción6204
THINKPensamiento6769
CHANGECambio83,358
CAUSECausación/acción143,739
MOVEMovimiento62,182
COMMUNICATEComunicación6586
TRANSFERTransferencia4530
SOCIALAcción social6387

Sub-primitives de mayor frecuencia (código de 4 bits)

Sub-primitiveCódigoVerbosProporciónEjemplo
CHANGE-TRANSFORM00003,06322.2%“cambiar”, “convertirse”
CAUSE-USE00011,3589.9%“usar”, “utilizar”
MOVE-DISPLACE00101,0257.4%“desplazar”
MOVE-GO00119426.8%“ir”

Los 4 Sub-primitives superiores representan el 46.4% del total.

Filosofía de diseño

Razón de elegir codificación Huffman

Razón de eliminar los bits de Primitive

Mantenimiento del agrupamiento semántico

La clasificación por Primitives se mantiene para la legibilidad humana y como pistas de agrupamiento semántico durante el entrenamiento de LLMs.