Clause Edge ist ein Edge-Typ, der die logischen und diskursiven Beziehungen zwischen Praedikationen (Verb Edge), Ereignissen (Event6 Edge), Relationen (Triple Edge) oder anderen Clauses ausdrueckt.

Er basiert auf den Diskursrelationen der RST (Rhetorical Structure Theory).

Paketstruktur (4 Woerter, 64 Bit)

1st WORD (16 Bit):
┌─────────────────────┬────────────┬────────┐
│      Prefix         │ Rel.-Typ   │ Reserv.│
│       10 Bit        │   4 Bit    │ 2 Bit  │
└─────────────────────┴────────────┴────────┘
 [1100 000 010]        [RRRR]       [xx]

2nd WORD: Edge TID (16 Bit)
3rd WORD: TID 1 (16 Bit) - erste Klausel
4th WORD: TID 2 (16 Bit) - zweite Klausel
FeldBitsBeschreibung
Prefix101100 000 010
Beziehungstyp416 RST-Beziehungen
Reserviert2Fuer zukuenftige Erweiterung
Edge TID16Eindeutiger Identifikator dieses Edge
TID 116Referenz zur ersten Klausel
TID 216Referenz zur zweiten Klausel

Beziehungstypen (4 Bit = 16)

Kausale Beziehungen

CodeTypBeschreibungBeispiel
0000CAUSEUrsache→Wirkung“Weil es regnete, blieb ich zu Hause”
0001RESULTWirkung←Ursache“Ich blieb zu Hause, denn es regnete”
0010CONDITIONBedingung→Folge“Wenn es regnet, gehe ich nicht”
0011PURPOSEZweck“Man isst, um zu leben”

Zeitliche/Sequenzielle Beziehungen

CodeTypBeschreibungBeispiel
0100SEQUENCEChronologisch“Ich ass und schlief dann”
0101PARALLELGleichzeitig/Parallel“Er sprach laechelnd”

Kontrast/Konzessive Beziehungen

CodeTypBeschreibungBeispiel
0110CONTRASTKontrast“A ist gross und B ist klein”
0111CONCESSIONKonzession“Obwohl es schwer war, tat er es”

Elaboration/Hintergrund

CodeTypBeschreibungBeispiel
1000ELABORATIONAusfuehrung“Genauer gesagt…”
1001BACKGROUNDHintergrundinformation“Zur Information: die damalige Lage war…”

Argumentative Beziehungen

CodeTypBeschreibungBeispiel
1010EVIDENCEBeweisfuehrung“Weil… deswegen”
1011EVALUATIONBewertung“Das ist gut/schlecht”

Sonstige Beziehungen

CodeTypBeschreibungBeispiel
1100SOLUTIONHOODProblem→Loesung“Das Problem ist X, die Loesung ist Y”
1101ALTERNATIVEWahl/Alternative“Gehen oder nicht gehen”
1110MEANSMittel“So hat er es erreicht”
1111RESERVEDReserviertFuer zukuenftige Erweiterung

TID-Reihenfolgeregel

Die Richtung wird durch die TID-Reihenfolge bestimmt.

BeziehungTID 1TID 2
CAUSEUrsacheWirkung
RESULTWirkungUrsache
CONDITIONBedingungFolge
PURPOSEHandlungZweck
SEQUENCEVorhergehendNachfolgend
EVIDENCEBeweisBehauptung
ELABORATIONKernAusfuehrung

Multinuclear vs Nucleus-Satellite

Gemaess RST-Unterscheidung.

Nucleus-Satellite (asymmetrisch)

BeziehungTID 1TID 2
CAUSEUrsache (Satellite)Wirkung (Nucleus)
CONDITIONBedingung (Satellite)Folge (Nucleus)
EVIDENCEBeweis (Satellite)Behauptung (Nucleus)
ELABORATIONKern (Nucleus)Ausfuehrung (Satellite)

Multinuclear (symmetrisch)

BeziehungTID 1TID 2
SEQUENCEVorhergehendNachfolgend
PARALLELErstesZweites
CONTRASTErstesZweites
ALTERNATIVEErstesZweites

Bei symmetrischen Beziehungen zeigt die TID-Reihenfolge keine semantische Prioritaet an.

Beispiele

Einfache Kausalitaet: “Weil es regnete, blieb ich zu Hause”

Verb Edge E01: rain(Regen) | TID=0x0001
Verb Edge E02: stay(ich, Zuhause) | TID=0x0002

Clause Edge:
  1st: [1100 000 010] [0000] [00]  - Prefix + CAUSE + Reserviert
  2nd: [0x0100]                    - Edge TID
  3rd: [0x0001]                    - TID 1 (Ursache: E01)
  4th: [0x0002]                    - TID 2 (Wirkung: E02)

Verschachtelte Clause: “Weil es regnete, blieb ich zu Hause, und deshalb habe ich gelernt”

Verb Edge E01: rain(Regen) | TID=0x0001
Verb Edge E02: stay(ich, Zuhause) | TID=0x0002
Verb Edge E03: study(ich) | TID=0x0003

Clause Edge C01:
  1st: [1100 000 010] [0000] [00]  - Prefix + CAUSE
  2nd: [0x0100]                    - Edge TID
  3rd: [0x0001]                    - E01
  4th: [0x0002]                    - E02

Clause Edge C02:
  1st: [1100 000 010] [0001] [00]  - Prefix + RESULT
  2nd: [0x0101]                    - Edge TID
  3rd: [0x0100]                    - C01 (Referenz auf Clause-TID!)
  4th: [0x0003]                    - E03

Designbegruendung

Warum RST

  • Ueber 30 Jahre akkumulierte Forschung
  • Validierung an diversen Korpora
  • Vorhandene Diskursanalyse-Werkzeuge
  • Sprachunabhaengig

Warum 4 Bit (16)

  • Deckt ueber 12 wesentliche RST-Beziehungen ab
  • Erweiterungsspielraum erhalten
  • 3 Bit (8) waeren unzureichend

Warum vereinfacht auf 4 Woerter

  • Richtung: durch TID-Reihenfolge bestimmt (kein zusaetzliches Bit noetig)
  • Sicherheit: als separate Metadaten behandelt
  • 2 Bit reserviert: fuer zukuenftige Erweiterung