קשת פועל
Verb Edge הוא סוג Edge המבטא תיאור/פעולה בזרימת GEUL. הוא מסווג 13,767 פעלים מ-WordNet ל-10 Primitive → 68 Sub-primitive ויוצר ספר קודים של 16 סיביות באמצעות קידוד הופמן ברמת Sub-primitive.
מסמכי משנה
מבנה הפעלים ההיררכי
10 Primitive (קטגוריה סמנטית עליונה)
├── BE ├── PERCEIVE ├── FEEL
├── THINK ├── CHANGE ├── CAUSE
├── MOVE ├── COMMUNICATE ├── TRANSFER
└── SOCIAL
→ 68 Sub-primitive (סיווג ביניים)
→ 559 Root Verb (פועל שורש)
→ 13,767 Leaf Verb (כל פעלי WordNet)
- Primitive (סיווג גדול) אחראי רק על קיבוץ מושגי ללא הקצאת סיביות
- 68 Sub-primitive (סיווג קטן) מקבלים קודים באורך משתנה על בסיס תדירות
- קבוצות פעלים בתדירות גבוהה יותר מקבלות קודים קצרים יותר (4-8 סיביות)
סוגי מנות Verb Edge
כל שלושת סוגי המנות Tiny/Short/Full חולקים אותו גוף פועל של 16 סיביות במילה האחרונה.
| Tiny | Short | Full |
|---|
| מילים | 2 (32bit) | 3 (48bit) | 5 (80bit) |
| משתתפים | 16 דפוסים | 512 דפוסים | דגלי 19bit |
| מגדירים | 7 דפוסים | 3,640 דפוסים | 27bit |
| גוף פועל | 16bit | 16bit | 16bit |
| שיעור צפוי | 90% | 7% | 3% |
גודל מנה ממוצע: 0.9×2 + 0.07×3 + 0.03×5 = 2.16 מילים
Tiny Verb Edge (2 מילים)
1st WORD: [Prefix 5bit] [Target×Pattern 11bit]
2nd WORD: [Verb Body 16bit]
- Target×Pattern: 18 Target × 113 דפוס = 2,034 צירופים
- משתתפים 16 דפוסים × מגדירים 7 דפוסים = 112 + שמור 1 = 113
- שיעור כיסוי ~90%
Short Verb Edge (3 מילים)
1st WORD: [Prefix 6bit] [Type 1bit=0] [ParticipantPattern 9bit]
2nd WORD: [Target×QualifierPattern 16bit]
3rd WORD: [Verb Body 16bit]
Full Verb Edge (5 מילים)
1st WORD: [Prefix 6bit] [Type 1bit=1] [TargetParticipant 5bit] [ParticipantFlags 4bit]
2nd+3rd: [ParticipantFlags 15bit] [Qualifier 17bit]
4th WORD: [Qualifier 10bit] [Reserved 6bit]
5th WORD: [Verb Body 16bit]
גוף הפועל 16 סיביות
┌─────────────────────────┬────────────────────────────┐
│ sub_primitive code │ DFS index in tree │
│ (4-8 bits, Huffman) │ (8-12 bits) │
└─────────────────────────┴────────────────────────────┘
- sub_primitive code: 4~8 סיביות משתנה (קוד הופמן)
- DFS index: זיהוי הפועל הבודד בתוך ה-sub_primitive הרלוונטי
התפלגות אורכי קוד
| אורך קוד | כמות | סכום פעלים | שיעור |
|---|
| 4 סיביות | 4 | 6,388 | 46.4% |
| 5 סיביות | 4 | 2,479 | 18.0% |
| 6 סיביות | 8 | 2,321 | 16.9% |
| 7 סיביות | 16 | 1,786 | 13.0% |
| 8 סיביות | 36 | 813 | 5.9% |
חישוב סיביות DFS index
| מספר פעלים ב-sub_primitive | סיביות נדרשות |
|---|
| 1~256 | 8 סיביות |
| 257~512 | 9 סיביות |
| 513~1024 | 10 סיביות |
| 1025~2048 | 11 סיביות |
| 2049~4096 | 12 סיביות |
דוגמה: CHANGE-TRANSFORM = 0000 (4 סיביות) + 3,063 פעלים (12 סיביות) = 16 סיביות.
אורך קוד ממוצע
Average = Σ(code_length × verb_count) / total_verbs ≈ 5.14 bits
| שיטה | ממוצע סיביות |
|---|
| קבוע 7 סיביות (68 פריטים) | 7.00 |
| קידוד הופמן | 5.14 |
| חיסכון | 1.86 סיביות (27%) |
סיווג גדול Primitive (10 סוגים)
| Primitive | משמעות | מספר Sub-primitive | מספר פעלים |
|---|
| BE | מצב/קיום | 8 | 899 |
| PERCEIVE | תפיסה/הכרה | 4 | 218 |
| FEEL | רגש | 6 | 204 |
| THINK | חשיבה | 6 | 769 |
| CHANGE | שינוי | 8 | 3,358 |
| CAUSE | גרימה/פעולה | 14 | 3,739 |
| MOVE | תנועה | 6 | 2,182 |
| COMMUNICATE | תקשורת | 6 | 586 |
| TRANSFER | העברה | 4 | 530 |
| SOCIAL | פעולה חברתית | 6 | 387 |
Sub-primitive בתדירות הגבוהה ביותר (קוד 4 סיביות)
| Sub-primitive | קוד | מספר פעלים | שיעור | דוגמה |
|---|
| CHANGE-TRANSFORM | 0000 | 3,063 | 22.2% | “להשתנות”, “להפוך” |
| CAUSE-USE | 0001 | 1,358 | 9.9% | “להשתמש” |
| MOVE-DISPLACE | 0010 | 1,025 | 7.4% | “להעביר” |
| MOVE-GO | 0011 | 942 | 6.8% | “ללכת” |
ארבעת ה-Sub-primitive העליונים מהווים 46.4% מהכלל.
פילוסופיית עיצוב
מדוע נבחר קידוד הופמן
- CHANGE-TRANSFORM (22.2%) בתדירות דומיננטית
- חיסכון של 27% בממוצע סיביות לעומת הקצאה קבועה
- ארבעת ה-sub_primitive העליונים מהווים 46.4% מהכלל
מדוע הוסרו סיביות Primitive
- בעבר: Primitive 3 סיביות + Sub_primitive 4 סיביות = 7 סיביות קבועות
- כעת: קידוד ישיר של Sub_primitive = 4~8 סיביות משתנות
- חיסכון של עד 4 סיביות בפעלים בתדירות גבוהה
שימור קיבוץ סמנטי
סיווג Primitive נשמר לצורך קריאות אנושית ורמזי קיבוץ סמנטי בעת אימון LLM.