Verb Edge

Verb Edge adalah tipe Edge dalam aliran GEUL untuk menyatakan predikat/tindakan. 13.767 kata kerja WordNet diklasifikasikan ke dalam 10 Primitive → 68 Sub-primitive, dan pengkodean Huffman per Sub-primitive menghasilkan codebook 16-bit.

Dokumen Turunan

DokumenDeskripsi
Peran Partisipan16 Semantic Role (encoding 4-bit)
Kualifikator Semantik14 kualifikator: evidensialitas, modus, tense, aspek, dll.

Hierarki Kata Kerja

10 Primitive (kategori semantik teratas)
 ├── BE          ├── PERCEIVE    ├── FEEL
 ├── THINK       ├── CHANGE      ├── CAUSE
 ├── MOVE        ├── COMMUNICATE ├── TRANSFER
 └── SOCIAL
  → 68 Sub-primitive (klasifikasi menengah)
    → 559 Root Verb (kata kerja akar)
      → 13,767 Leaf Verb (semua kata kerja WordNet)

Tipe Paket Verb Edge

Ketiga tipe Tiny/Short/Full berbagi badan kata kerja 16-bit yang sama di word terakhir.

TinyShortFull
Word2 (32bit)3 (48bit)5 (80bit)
Partisipan16 pola512 pola19bit flag
Kualifikator7 pola3.640 pola27bit
Badan kata kerja16bit16bit16bit
Perkiraan rasio90%7%3%

Ukuran paket rata-rata: 0,9×2 + 0,07×3 + 0,03×5 = 2,16 word

Tiny Verb Edge (2 word)

1st WORD:  [Prefix 5bit] [Target×pola 11bit]
2nd WORD:  [badan kata kerja 16bit]

Short Verb Edge (3 word)

1st WORD:  [Prefix 6bit] [Type 1bit=0] [pola partisipan 9bit]
2nd WORD:  [Target×pola kualifikator 16bit]
3rd WORD:  [badan kata kerja 16bit]

Full Verb Edge (5 word)

1st WORD:  [Prefix 6bit] [Type 1bit=1] [Target partisipan 5bit] [flag partisipan 4bit]
2nd+3rd:   [flag partisipan 15bit] [kualifikator 17bit]
4th WORD:  [kualifikator 10bit] [cadangan 6bit]
5th WORD:  [badan kata kerja 16bit]

Badan Kata Kerja 16-bit

┌─────────────────────────┬────────────────────────────┐
│   sub_primitive code    │     DFS index dalam tree   │
│   (4-8 bit, Huffman)    │     (8-12 bit)             │
└─────────────────────────┴────────────────────────────┘

Distribusi Panjang Kode

Panjang kodeJumlahTotal kata kerjaRasio
4 bit46.38846,4%
5 bit42.47918,0%
6 bit82.32116,9%
7 bit161.78613,0%
8 bit368135,9%

Perhitungan Bit DFS index

Jumlah kata kerja sub_primitiveBit diperlukan
1~2568 bit
257~5129 bit
513~102410 bit
1025~204811 bit
2049~409612 bit

Contoh: CHANGE-TRANSFORM = 0000(4 bit) + 3.063 kata kerja (12 bit) = 16 bit.

Panjang Kode Rata-rata

Rata-rata = Σ(panjang kode × jumlah kata kerja) / total kata kerja ≈ 5,14 bit
MetodeRata-rata bit
Tetap 7 bit (68)7,00
Pengkodean Huffman5,14
Penghematan1,86 bit (27%)

Primitive Kategori Besar (10)

PrimitiveMaknaJumlah Sub-primitiveJumlah kata kerja
BEKeadaan/keberadaan8899
PERCEIVEPersepsi/kognisi4218
FEELEmosi6204
THINKPemikiran6769
CHANGEPerubahan83.358
CAUSEPenyebab/tindakan143.739
MOVEPerpindahan62.182
COMMUNICATEKomunikasi6586
TRANSFERTransfer4530
SOCIALTindakan sosial6387

Sub-primitive Frekuensi Tertinggi (kode 4-bit)

Sub-primitiveKodeKata kerjaRasioContoh
CHANGE-TRANSFORM00003.06322,2%“berubah”, “menjadi”
CAUSE-USE00011.3589,9%“menggunakan”, “memakai”
MOVE-DISPLACE00101.0257,4%“memindahkan”
MOVE-GO00119426,8%“pergi”

Empat Sub-primitive teratas mencakup 46,4% dari seluruh kata kerja.

Filosofi Desain

Alasan Memilih Pengkodean Huffman

Alasan Menghapus Bit Primitive

Mempertahankan Pengelompokan Semantik

Klasifikasi Primitive dipertahankan untuk keterbacaan manusia dan sebagai petunjuk klasterisasi semantik saat pelatihan LLM.