Clause Edge — тип Edge для выражения логических/дискурсивных связей между предикатами (Verb Edge), событиями (Event6 Edge), отношениями (Triple Edge) или другими Clause.
Спроектирован на основе дискурсивных отношений RST (Rhetorical Structure Theory).
Структура пакета (4 слова, 64 бита)
1st WORD (16 бит):
┌─────────────────────┬────────────┬────────┐
│ Prefix │ Тип связи │ Резерв │
│ 10 бит │ 4 бита │ 2 бита │
└─────────────────────┴────────────┴────────┘
[1100 000 010] [RRRR] [xx]
2nd WORD: Edge TID (16 бит)
3rd WORD: TID 1 (16 бит) - первая клауза
4th WORD: TID 2 (16 бит) - вторая клауза
| Поле | Биты | Описание |
|---|
| Prefix | 10 | 1100 000 010 |
| Тип связи | 4 | 16 дискурсивных связей RST |
| Резерв | 2 | Для будущего расширения |
| Edge TID | 16 | Уникальный ID этого Edge |
| TID 1 | 16 | Ссылка на первую клаузу |
| TID 2 | 16 | Ссылка на вторую клаузу |
Типы связей (4 бита = 16)
Причинно-следственные
| Код | Тип | Описание | Пример |
|---|
| 0000 | CAUSE | Причина→следствие | «Шёл дождь, поэтому остался дома» |
| 0001 | RESULT | Следствие←причина | «Остался дома, потому что шёл дождь» |
| 0010 | CONDITION | Условие→следствие | «Если будет дождь, не пойду» |
| 0011 | PURPOSE | Цель | «Ест, чтобы жить» |
Временные/порядковые
| Код | Тип | Описание | Пример |
|---|
| 0100 | SEQUENCE | Хронология | «Поел, затем лёг спать» |
| 0101 | PARALLEL | Одновременность | «Говорил, улыбаясь» |
Контрастные/уступительные
| Код | Тип | Описание | Пример |
|---|
| 0110 | CONTRAST | Контраст | «A большой, а B маленький» |
| 0111 | CONCESSION | Уступка | «Трудно, но сделал» |
Дополнительные/фоновые
| Код | Тип | Описание | Пример |
|---|
| 1000 | ELABORATION | Детализация | «Конкретнее говоря» |
| 1001 | BACKGROUND | Фоновая информация | «К сведению, обстановка была…» |
Аргументативные
| Код | Тип | Описание | Пример |
|---|
| 1010 | EVIDENCE | Доказательство | «Потому что… вот почему» |
| 1011 | EVALUATION | Оценка | «Это хорошо/плохо» |
Прочие
| Код | Тип | Описание | Пример |
|---|
| 1100 | SOLUTIONHOOD | Проблема→решение | «Проблема X, решение Y» |
| 1101 | ALTERNATIVE | Альтернатива | «Либо пойти, либо нет» |
| 1110 | MEANS | Средство | «Так достиг этого» |
| 1111 | RESERVED | Резерв | Для будущего расширения |
Правила порядка TID
Направление определяется порядком TID.
| Связь | TID 1 | TID 2 |
|---|
| CAUSE | Причина | Следствие |
| RESULT | Следствие | Причина |
| CONDITION | Условие | Следствие |
| PURPOSE | Действие | Цель |
| SEQUENCE | Предшествующее | Последующее |
| EVIDENCE | Доказательство | Утверждение |
| ELABORATION | Ключевое | Дополнение |
Multinuclear vs Nucleus-Satellite
Следует различению RST.
Nucleus-Satellite (асимметричные)
| Связь | TID 1 | TID 2 |
|---|
| CAUSE | Причина (Satellite) | Следствие (Nucleus) |
| CONDITION | Условие (Satellite) | Следствие (Nucleus) |
| EVIDENCE | Доказательство (Satellite) | Утверждение (Nucleus) |
| ELABORATION | Ключевое (Nucleus) | Дополнение (Satellite) |
Multinuclear (симметричные)
| Связь | TID 1 | TID 2 |
|---|
| SEQUENCE | Предшествующее | Последующее |
| PARALLEL | Первое | Второе |
| CONTRAST | Первое | Второе |
| ALTERNATIVE | Первое | Второе |
В симметричных связях порядок TID не указывает на семантический приоритет.
Примеры
Простая причинность: «Шёл дождь, поэтому остался дома»
Verb Edge E01: rain(дождь) | TID=0x0001
Verb Edge E02: stay(я, дом) | TID=0x0002
Clause Edge:
1st: [1100 000 010] [0000] [00] - Prefix + CAUSE + резерв
2nd: [0x0100] - Edge TID
3rd: [0x0001] - TID 1 (причина: E01)
4th: [0x0002] - TID 2 (следствие: E02)
Вложенные Clause: «Шёл дождь, поэтому остался дома, и потому занимался»
Verb Edge E01: rain(дождь) | TID=0x0001
Verb Edge E02: stay(я, дом) | TID=0x0002
Verb Edge E03: study(я) | TID=0x0003
Clause Edge C01:
1st: [1100 000 010] [0000] [00] - Prefix + CAUSE
2nd: [0x0100] - Edge TID
3rd: [0x0001] - E01
4th: [0x0002] - E02
Clause Edge C02:
1st: [1100 000 010] [0001] [00] - Prefix + RESULT
2nd: [0x0101] - Edge TID
3rd: [0x0100] - C01 (ссылка на Clause TID!)
4th: [0x0003] - E03
Обоснование проектирования
Почему RST
- Более 30 лет исследований
- Проверено на разнообразных корпусах
- Существуют инструменты дискурсивного разбора
- Языково-независимо
Почему 4 бита (16 типов)
- Покрывает более 12 ключевых связей RST
- Запас для расширения
- 3 бита (8 типов) — недостаточно
Почему упрощение до 4 слов
- Направление: определяется порядком TID (доп. биты не нужны)
- Уверенность: обрабатывается отдельными метаданными
- 2 бита резерва: для будущего расширения