Clause Edge — тип Edge для выражения логических/дискурсивных связей между предикатами (Verb Edge), событиями (Event6 Edge), отношениями (Triple Edge) или другими Clause.

Спроектирован на основе дискурсивных отношений RST (Rhetorical Structure Theory).

Структура пакета (4 слова, 64 бита)

1st WORD (16 бит):
┌─────────────────────┬────────────┬────────┐
│      Prefix         │ Тип связи  │ Резерв │
│       10 бит        │   4 бита   │ 2 бита │
└─────────────────────┴────────────┴────────┘
 [1100 000 010]        [RRRR]       [xx]

2nd WORD: Edge TID (16 бит)
3rd WORD: TID 1 (16 бит) - первая клауза
4th WORD: TID 2 (16 бит) - вторая клауза
ПолеБитыОписание
Prefix101100 000 010
Тип связи416 дискурсивных связей RST
Резерв2Для будущего расширения
Edge TID16Уникальный ID этого Edge
TID 116Ссылка на первую клаузу
TID 216Ссылка на вторую клаузу

Типы связей (4 бита = 16)

Причинно-следственные

КодТипОписаниеПример
0000CAUSEПричина→следствие«Шёл дождь, поэтому остался дома»
0001RESULTСледствие←причина«Остался дома, потому что шёл дождь»
0010CONDITIONУсловие→следствие«Если будет дождь, не пойду»
0011PURPOSEЦель«Ест, чтобы жить»

Временные/порядковые

КодТипОписаниеПример
0100SEQUENCEХронология«Поел, затем лёг спать»
0101PARALLELОдновременность«Говорил, улыбаясь»

Контрастные/уступительные

КодТипОписаниеПример
0110CONTRASTКонтраст«A большой, а B маленький»
0111CONCESSIONУступка«Трудно, но сделал»

Дополнительные/фоновые

КодТипОписаниеПример
1000ELABORATIONДетализация«Конкретнее говоря»
1001BACKGROUNDФоновая информация«К сведению, обстановка была…»

Аргументативные

КодТипОписаниеПример
1010EVIDENCEДоказательство«Потому что… вот почему»
1011EVALUATIONОценка«Это хорошо/плохо»

Прочие

КодТипОписаниеПример
1100SOLUTIONHOODПроблема→решение«Проблема X, решение Y»
1101ALTERNATIVEАльтернатива«Либо пойти, либо нет»
1110MEANSСредство«Так достиг этого»
1111RESERVEDРезервДля будущего расширения

Правила порядка TID

Направление определяется порядком TID.

СвязьTID 1TID 2
CAUSEПричинаСледствие
RESULTСледствиеПричина
CONDITIONУсловиеСледствие
PURPOSEДействиеЦель
SEQUENCEПредшествующееПоследующее
EVIDENCEДоказательствоУтверждение
ELABORATIONКлючевоеДополнение

Multinuclear vs Nucleus-Satellite

Следует различению RST.

Nucleus-Satellite (асимметричные)

СвязьTID 1TID 2
CAUSEПричина (Satellite)Следствие (Nucleus)
CONDITIONУсловие (Satellite)Следствие (Nucleus)
EVIDENCEДоказательство (Satellite)Утверждение (Nucleus)
ELABORATIONКлючевое (Nucleus)Дополнение (Satellite)

Multinuclear (симметричные)

СвязьTID 1TID 2
SEQUENCEПредшествующееПоследующее
PARALLELПервоеВторое
CONTRASTПервоеВторое
ALTERNATIVEПервоеВторое

В симметричных связях порядок TID не указывает на семантический приоритет.

Примеры

Простая причинность: «Шёл дождь, поэтому остался дома»

Verb Edge E01: rain(дождь) | TID=0x0001
Verb Edge E02: stay(я, дом) | TID=0x0002

Clause Edge:
  1st: [1100 000 010] [0000] [00]  - Prefix + CAUSE + резерв
  2nd: [0x0100]                    - Edge TID
  3rd: [0x0001]                    - TID 1 (причина: E01)
  4th: [0x0002]                    - TID 2 (следствие: E02)

Вложенные Clause: «Шёл дождь, поэтому остался дома, и потому занимался»

Verb Edge E01: rain(дождь) | TID=0x0001
Verb Edge E02: stay(я, дом) | TID=0x0002
Verb Edge E03: study(я) | TID=0x0003

Clause Edge C01:
  1st: [1100 000 010] [0000] [00]  - Prefix + CAUSE
  2nd: [0x0100]                    - Edge TID
  3rd: [0x0001]                    - E01
  4th: [0x0002]                    - E02

Clause Edge C02:
  1st: [1100 000 010] [0001] [00]  - Prefix + RESULT
  2nd: [0x0101]                    - Edge TID
  3rd: [0x0100]                    - C01 (ссылка на Clause TID!)
  4th: [0x0003]                    - E03

Обоснование проектирования

Почему RST

  • Более 30 лет исследований
  • Проверено на разнообразных корпусах
  • Существуют инструменты дискурсивного разбора
  • Языково-независимо

Почему 4 бита (16 типов)

  • Покрывает более 12 ключевых связей RST
  • Запас для расширения
  • 3 бита (8 типов) — недостаточно

Почему упрощение до 4 слов

  • Направление: определяется порядком TID (доп. биты не нужны)
  • Уверенность: обрабатывается отдельными метаданными
  • 2 бита резерва: для будущего расширения