Verb Edge

Verb Edge est le type d’Edge qui represente les predications et actions dans le flux GEUL. Il classifie 13 767 verbes WordNet en 10 Primitive → 68 Sub-primitive et genere un codebook 16 bits par codage de Huffman au niveau Sub-primitive.

Sous-documents

DocumentDescription
Roles des participants16 Semantic Role (encodage 4 bits)
Qualificateurs semantiquesEvidentialite, mode, temps, aspect, etc. — 14 qualificateurs

Hierarchie des verbes

10 Primitive (categories semantiques superieures)
 ├── BE          ├── PERCEIVE    ├── FEEL
 ├── THINK       ├── CHANGE      ├── CAUSE
 ├── MOVE        ├── COMMUNICATE ├── TRANSFER
 └── SOCIAL
  → 68 Sub-primitive (classification intermediaire)
    → 559 Root Verb (verbes racines)
      → 13,767 Leaf Verb (tous les verbes WordNet)

Types de paquets Verb Edge

Les 3 types de paquets Tiny/Short/Full partagent tous le meme corps de verbe 16 bits dans le dernier mot.

TinyShortFull
Mots2 (32 bit)3 (48 bit)5 (80 bit)
Participants16 motifs512 motifs19 bit drapeaux
Qualificateurs7 motifs3 640 motifs27 bit
Corps du verbe16 bit16 bit16 bit
Ratio estime90%7%3%

Taille moyenne de paquet : 0.9x2 + 0.07x3 + 0.03x5 = 2,16 mots

Tiny Verb Edge (2 mots)

1st WORD:  [Prefix 5bit] [Target×motif 11bit]
2nd WORD:  [Corps du verbe 16bit]

Short Verb Edge (3 mots)

1st WORD:  [Prefix 6bit] [Type 1bit=0] [motif participants 9bit]
2nd WORD:  [Target×motif qualificateurs 16bit]
3rd WORD:  [Corps du verbe 16bit]

Full Verb Edge (5 mots)

1st WORD:  [Prefix 6bit] [Type 1bit=1] [Target participant 5bit] [drapeaux participants 4bit]
2nd+3rd:   [drapeaux participants 15bit] [qualificateurs 17bit]
4th WORD:  [qualificateurs 10bit] [reserve 6bit]
5th WORD:  [Corps du verbe 16bit]

Corps du verbe 16 bits

┌─────────────────────────┬────────────────────────────┐
│   sub_primitive code    │     DFS index dans l'arbre │
│   (4-8 bits, Huffman)   │     (8-12 bits)            │
└─────────────────────────┴────────────────────────────┘

Distribution des longueurs de code

Longueur du codeNombreTotal verbesRatio
4 bits46 38846.4%
5 bits42 47918.0%
6 bits82 32116.9%
7 bits161 78613.0%
8 bits368135.9%

Calcul des bits DFS index

Nb verbes sub_primitiveBits necessaires
1~2568 bits
257~5129 bits
513~102410 bits
1025~204811 bits
2049~409612 bits

Exemple : CHANGE-TRANSFORM = 0000 (4 bits) + 3 063 verbes (12 bits) = 16 bits.

Longueur moyenne de code

Moyenne = Sigma(longueur_code x nb_verbes) / total_verbes ≈ 5,14 bits
MethodeBits moyens
Fixe 7 bits (68)7.00
Codage de Huffman5.14
Economie1,86 bits (27%)

Primitive — categories principales (10)

PrimitiveSignificationNb Sub-primitiveNb verbes
BEEtat/Existence8899
PERCEIVEPerception/Cognition4218
FEELEmotion6204
THINKPensee6769
CHANGEChangement83 358
CAUSECausation/Action143 739
MOVEMouvement62 182
COMMUNICATECommunication6586
TRANSFERTransfert4530
SOCIALAction sociale6387

Sub-primitive les plus frequents (codes 4 bits)

Sub-primitiveCodeNb verbesRatioExemple
CHANGE-TRANSFORM00003 06322.2%“changer”, “devenir”
CAUSE-USE00011 3589.9%“utiliser”, “employer”
MOVE-DISPLACE00101 0257.4%“deplacer”
MOVE-GO00119426.8%“aller”

Les 4 premiers Sub-primitive representent 46,4% du total.

Philosophie de conception

Raison du choix du codage de Huffman

Raison de la suppression des bits Primitive

Maintien du regroupement semantique

La classification Primitive est maintenue pour la lisibilite humaine et comme indice de clustering semantique lors de l’apprentissage LLM.