Clause Edge הוא סוג Edge המבטא יחסים לוגיים/שיחיים בין תיאורים (קשת פועל), אירועים (קשת אירוע6), יחסים (קשת שלישייה), או Clause אחרות.

עוצב על בסיס יחסי שיח של RST (Rhetorical Structure Theory).

מבנה המנה (4 מילים, 64 סיביות)

1st WORD (16 bits):
┌─────────────────────┬────────────┬────────┐
│      Prefix         │  RelType   │ Reserv │
│       10bit         │   4bit     │  2bit  │
└─────────────────────┴────────────┴────────┘
 [1100 000 010]        [RRRR]       [xx]

2nd WORD: Edge TID (16 bits)
3rd WORD: TID 1 (16 bits) - first clause
4th WORD: TID 2 (16 bits) - second clause
שדהסיביותתיאור
Prefix101100 000 010
RelType416 יחסי RST
Reserved2להרחבה עתידית
Edge TID16מזהה ייחודי של Edge זה
TID 116הפניה לפסוקית הראשונה
TID 216הפניה לפסוקית השנייה

סוגי יחסים (4 סיביות = 16 סוגים)

יחסי סיבה

קודסוגתיאורדוגמה
0000CAUSEסיבה→תוצאה“נשארתי בבית כי ירד גשם”
0001RESULTתוצאה←סיבה“נשארתי בבית, שהרי ירד גשם”
0010CONDITIONתנאי→מסקנה“אם ירד גשם לא אלך”
0011PURPOSEמטרה“אוכלים כדי לחיות”

יחסי זמן/סדר

קודסוגתיאורדוגמה
0100SEQUENCEסדר כרונולוגי“אכל ואז ישן”
0101PARALLELבו-זמני/מקביל“דיבר תוך כדי צחוק”

יחסי ניגוד/ויתור

קודסוגתיאורדוגמה
0110CONTRASTניגוד“א גדול וב קטן”
0111CONCESSIONויתור“למרות הקושי, עשה”

יחסי הרחבה/רקע

קודסוגתיאורדוגמה
1000ELABORATIONפירוט“ליתר דיוק”
1001BACKGROUNDמידע רקע“לידיעתך, המצב אז היה”

יחסי טיעון

קודסוגתיאורדוגמה
1010EVIDENCEהצגת ראיה“כי… ולכן”
1011EVALUATIONהערכה“זה טוב/רע”

יחסים אחרים

קודסוגתיאורדוגמה
1100SOLUTIONHOODבעיה→פתרון“הבעיה X, הפתרון Y”
1101ALTERNATIVEבחירה/חלופה“או הלך או נשאר”
1110MEANSאמצעי“השיג זאת בדרך זו”
1111RESERVEDשמורלהרחבה עתידית

כלל סדר TID

הכיוון נקבע לפי סדר TID.

יחסTID 1TID 2
CAUSEסיבהתוצאה
RESULTתוצאהסיבה
CONDITIONתנאימסקנה
PURPOSEפעולהמטרה
SEQUENCEקודםמאוחר
EVIDENCEראיהטענה
ELABORATIONגרעיןפירוט

Multinuclear מול Nucleus-Satellite

עוקב אחר סיווג RST.

Nucleus-Satellite (אסימטרי)

יחסTID 1TID 2
CAUSEסיבה (Satellite)תוצאה (Nucleus)
CONDITIONתנאי (Satellite)מסקנה (Nucleus)
EVIDENCEראיה (Satellite)טענה (Nucleus)
ELABORATIONגרעין (Nucleus)פירוט (Satellite)

Multinuclear (סימטרי)

יחסTID 1TID 2
SEQUENCEקודםמאוחר
PARALLELראשוןשני
CONTRASTראשוןשני
ALTERNATIVEראשוןשני

ביחסים סימטריים סדר TID אינו מציין עדיפות סמנטית.

דוגמאות

סיבה פשוטה: “נשארתי בבית כי ירד גשם”

Verb Edge E01: rain (גשם) | TID=0x0001
Verb Edge E02: stay (אני, בית) | TID=0x0002

Clause Edge:
  1st: [1100 000 010] [0000] [00]  - Prefix + CAUSE + Reserved
  2nd: [0x0100]                    - Edge TID
  3rd: [0x0001]                    - TID 1 (cause: E01)
  4th: [0x0002]                    - TID 2 (result: E02)

Clause מקוננת: “נשארתי כי ירד גשם, ולכן למדתי”

Verb Edge E01: rain (גשם) | TID=0x0001
Verb Edge E02: stay (אני, בית) | TID=0x0002
Verb Edge E03: study (אני) | TID=0x0003

Clause Edge C01:
  1st: [1100 000 010] [0000] [00]  - Prefix + CAUSE
  2nd: [0x0100]                    - Edge TID
  3rd: [0x0001]                    - E01
  4th: [0x0002]                    - E02

Clause Edge C02:
  1st: [1100 000 010] [0001] [00]  - Prefix + RESULT
  2nd: [0x0101]                    - Edge TID
  3rd: [0x0100]                    - C01 (Clause TID reference!)
  4th: [0x0003]                    - E03

נימוקי עיצוב

מדוע RST

  • יותר מ-30 שנות מחקר מצטבר
  • אימות על פני קורפוסים מגוונים
  • כלי ניתוח שיח קיימים
  • בלתי תלוי בשפה

מדוע 4 סיביות (16 סוגים)

  • כיסוי של יותר מ-12 יחסי RST מרכזיים
  • שטח מספיק להרחבה
  • 3 סיביות (8 סוגים) אינן מספיקות

מדוע פישוט ל-4 מילים

  • כיוון: נקבע לפי סדר TID (אין צורך בסיבית נפרדת)
  • רמת ביטחון: מטופלת כמטא-נתונים נפרדים
  • 2 סיביות שמורות: להרחבה עתידית