Clause Edge הוא סוג Edge המבטא יחסים לוגיים/שיחיים בין תיאורים (קשת פועל), אירועים (קשת אירוע6), יחסים (קשת שלישייה), או Clause אחרות.
עוצב על בסיס יחסי שיח של RST (Rhetorical Structure Theory).
מבנה המנה (4 מילים, 64 סיביות)
1st WORD (16 bits):
┌─────────────────────┬────────────┬────────┐
│ Prefix │ RelType │ Reserv │
│ 10bit │ 4bit │ 2bit │
└─────────────────────┴────────────┴────────┘
[1100 000 010] [RRRR] [xx]
2nd WORD: Edge TID (16 bits)
3rd WORD: TID 1 (16 bits) - first clause
4th WORD: TID 2 (16 bits) - second clause
| שדה | סיביות | תיאור |
|---|
| Prefix | 10 | 1100 000 010 |
| RelType | 4 | 16 יחסי RST |
| Reserved | 2 | להרחבה עתידית |
| Edge TID | 16 | מזהה ייחודי של Edge זה |
| TID 1 | 16 | הפניה לפסוקית הראשונה |
| TID 2 | 16 | הפניה לפסוקית השנייה |
סוגי יחסים (4 סיביות = 16 סוגים)
יחסי סיבה
| קוד | סוג | תיאור | דוגמה |
|---|
| 0000 | CAUSE | סיבה→תוצאה | “נשארתי בבית כי ירד גשם” |
| 0001 | RESULT | תוצאה←סיבה | “נשארתי בבית, שהרי ירד גשם” |
| 0010 | CONDITION | תנאי→מסקנה | “אם ירד גשם לא אלך” |
| 0011 | PURPOSE | מטרה | “אוכלים כדי לחיות” |
יחסי זמן/סדר
| קוד | סוג | תיאור | דוגמה |
|---|
| 0100 | SEQUENCE | סדר כרונולוגי | “אכל ואז ישן” |
| 0101 | PARALLEL | בו-זמני/מקביל | “דיבר תוך כדי צחוק” |
יחסי ניגוד/ויתור
| קוד | סוג | תיאור | דוגמה |
|---|
| 0110 | CONTRAST | ניגוד | “א גדול וב קטן” |
| 0111 | CONCESSION | ויתור | “למרות הקושי, עשה” |
יחסי הרחבה/רקע
| קוד | סוג | תיאור | דוגמה |
|---|
| 1000 | ELABORATION | פירוט | “ליתר דיוק” |
| 1001 | BACKGROUND | מידע רקע | “לידיעתך, המצב אז היה” |
יחסי טיעון
| קוד | סוג | תיאור | דוגמה |
|---|
| 1010 | EVIDENCE | הצגת ראיה | “כי… ולכן” |
| 1011 | EVALUATION | הערכה | “זה טוב/רע” |
יחסים אחרים
| קוד | סוג | תיאור | דוגמה |
|---|
| 1100 | SOLUTIONHOOD | בעיה→פתרון | “הבעיה X, הפתרון Y” |
| 1101 | ALTERNATIVE | בחירה/חלופה | “או הלך או נשאר” |
| 1110 | MEANS | אמצעי | “השיג זאת בדרך זו” |
| 1111 | RESERVED | שמור | להרחבה עתידית |
כלל סדר TID
הכיוון נקבע לפי סדר TID.
| יחס | TID 1 | TID 2 |
|---|
| CAUSE | סיבה | תוצאה |
| RESULT | תוצאה | סיבה |
| CONDITION | תנאי | מסקנה |
| PURPOSE | פעולה | מטרה |
| SEQUENCE | קודם | מאוחר |
| EVIDENCE | ראיה | טענה |
| ELABORATION | גרעין | פירוט |
Multinuclear מול Nucleus-Satellite
עוקב אחר סיווג RST.
Nucleus-Satellite (אסימטרי)
| יחס | TID 1 | TID 2 |
|---|
| CAUSE | סיבה (Satellite) | תוצאה (Nucleus) |
| CONDITION | תנאי (Satellite) | מסקנה (Nucleus) |
| EVIDENCE | ראיה (Satellite) | טענה (Nucleus) |
| ELABORATION | גרעין (Nucleus) | פירוט (Satellite) |
Multinuclear (סימטרי)
| יחס | TID 1 | TID 2 |
|---|
| SEQUENCE | קודם | מאוחר |
| PARALLEL | ראשון | שני |
| CONTRAST | ראשון | שני |
| ALTERNATIVE | ראשון | שני |
ביחסים סימטריים סדר TID אינו מציין עדיפות סמנטית.
דוגמאות
סיבה פשוטה: “נשארתי בבית כי ירד גשם”
Verb Edge E01: rain (גשם) | TID=0x0001
Verb Edge E02: stay (אני, בית) | TID=0x0002
Clause Edge:
1st: [1100 000 010] [0000] [00] - Prefix + CAUSE + Reserved
2nd: [0x0100] - Edge TID
3rd: [0x0001] - TID 1 (cause: E01)
4th: [0x0002] - TID 2 (result: E02)
Clause מקוננת: “נשארתי כי ירד גשם, ולכן למדתי”
Verb Edge E01: rain (גשם) | TID=0x0001
Verb Edge E02: stay (אני, בית) | TID=0x0002
Verb Edge E03: study (אני) | TID=0x0003
Clause Edge C01:
1st: [1100 000 010] [0000] [00] - Prefix + CAUSE
2nd: [0x0100] - Edge TID
3rd: [0x0001] - E01
4th: [0x0002] - E02
Clause Edge C02:
1st: [1100 000 010] [0001] [00] - Prefix + RESULT
2nd: [0x0101] - Edge TID
3rd: [0x0100] - C01 (Clause TID reference!)
4th: [0x0003] - E03
נימוקי עיצוב
מדוע RST
- יותר מ-30 שנות מחקר מצטבר
- אימות על פני קורפוסים מגוונים
- כלי ניתוח שיח קיימים
- בלתי תלוי בשפה
מדוע 4 סיביות (16 סוגים)
- כיסוי של יותר מ-12 יחסי RST מרכזיים
- שטח מספיק להרחבה
- 3 סיביות (8 סוגים) אינן מספיקות
מדוע פישוט ל-4 מילים
- כיוון: נקבע לפי סדר TID (אין צורך בסיבית נפרדת)
- רמת ביטחון: מטופלת כמטא-נתונים נפרדים
- 2 סיביות שמורות: להרחבה עתידית