Verb Edge

Verb Edge ist der Edge-Typ, der Praedikationen und Aktionen im GEUL-Stream darstellt. Er klassifiziert 13.767 WordNet-Verben in 10 Primitive → 68 Sub-primitive und erzeugt ein 16-Bit-Codebuch durch Huffman-Kodierung auf Sub-primitive-Ebene.

Unterdokumente

DokumentBeschreibung
Teilnehmerrollen16 Semantic Role (4-Bit-Kodierung)
Semantische QualifikatorenEvidentialitaet, Modus, Tempus, Aspekt usw. — 14 Qualifikatoren

Verbhierarchie

10 Primitive (oberste semantische Kategorien)
 ├── BE          ├── PERCEIVE    ├── FEEL
 ├── THINK       ├── CHANGE      ├── CAUSE
 ├── MOVE        ├── COMMUNICATE ├── TRANSFER
 └── SOCIAL
  → 68 Sub-primitive (Zwischenklassifikation)
    → 559 Root Verb (Wurzelverben)
      → 13,767 Leaf Verb (alle WordNet-Verben)

Verb Edge Pakettypen

Alle 3 Pakettypen Tiny/Short/Full teilen denselben 16-Bit-Verbkoerper im letzten Wort.

TinyShortFull
Woerter2 (32 Bit)3 (48 Bit)5 (80 Bit)
Teilnehmer16 Muster512 Muster19-Bit-Flags
Qualifikatoren7 Muster3.640 Muster27 Bit
Verbkoerper16 Bit16 Bit16 Bit
Geschaetzter Anteil90%7%3%

Durchschnittliche Paketgroesse: 0,9x2 + 0,07x3 + 0,03x5 = 2,16 Woerter

Tiny Verb Edge (2 Woerter)

1st WORD:  [Prefix 5bit] [Target×Muster 11bit]
2nd WORD:  [Verbkoerper 16bit]

Short Verb Edge (3 Woerter)

1st WORD:  [Prefix 6bit] [Type 1bit=0] [Teilnehmermuster 9bit]
2nd WORD:  [Target×Qualifikatormuster 16bit]
3rd WORD:  [Verbkoerper 16bit]

Full Verb Edge (5 Woerter)

1st WORD:  [Prefix 6bit] [Type 1bit=1] [Target Teilnehmer 5bit] [Teilnehmer-Flags 4bit]
2nd+3rd:   [Teilnehmer-Flags 15bit] [Qualifikatoren 17bit]
4th WORD:  [Qualifikatoren 10bit] [Reserviert 6bit]
5th WORD:  [Verbkoerper 16bit]

16-Bit-Verbkoerper

┌─────────────────────────┬────────────────────────────┐
│   sub_primitive code    │     DFS-Index im Baum      │
│   (4-8 Bit, Huffman)    │     (8-12 Bit)             │
└─────────────────────────┴────────────────────────────┘

Verteilung der Codelaengen

CodelaengeAnzahlGesamtverbenAnteil
4 Bit46.38846,4%
5 Bit42.47918,0%
6 Bit82.32116,9%
7 Bit161.78613,0%
8 Bit368135,9%

DFS-Index-Bit-Berechnung

Sub-primitive VerbanzahlBenoetigte Bits
1~2568 Bit
257~5129 Bit
513~102410 Bit
1025~204811 Bit
2049~409612 Bit

Beispiel: CHANGE-TRANSFORM = 0000 (4 Bit) + 3.063 Verben (12 Bit) = 16 Bit.

Durchschnittliche Codelaenge

Durchschnitt = Sigma(Codelaenge x Verbanzahl) / Gesamtverben ≈ 5,14 Bit
MethodeDurchschn. Bits
Fest 7 Bit (68)7,00
Huffman-Kodierung5,14
Einsparung1,86 Bit (27%)

Primitive — Hauptkategorien (10)

PrimitiveBedeutungAnz. Sub-primitiveAnz. Verben
BEZustand/Existenz8899
PERCEIVEWahrnehmung/Kognition4218
FEELEmotion6204
THINKDenken6769
CHANGEVeraenderung83.358
CAUSEVerursachung/Handlung143.739
MOVEBewegung62.182
COMMUNICATEKommunikation6586
TRANSFERUebertragung4530
SOCIALSoziale Handlung6387

Hoechstfrequente Sub-primitive (4-Bit-Codes)

Sub-primitiveCodeAnz. VerbenAnteilBeispiel
CHANGE-TRANSFORM00003.06322,2%“aendern”, “werden”
CAUSE-USE00011.3589,9%“benutzen”, “verwenden”
MOVE-DISPLACE00101.0257,4%“verschieben”
MOVE-GO00119426,8%“gehen”

Die oberen 4 Sub-primitive machen 46,4% des Gesamten aus.

Designphilosophie

Grund fuer die Wahl der Huffman-Kodierung

Grund fuer die Entfernung der Primitive-Bits

Beibehaltung der semantischen Gruppierung

Die Primitive-Klassifikation wird fuer die menschliche Lesbarkeit und als Hinweis fuer semantisches Clustering beim LLM-Training beibehalten.