Clause Edge は述語(動詞エッジ)、イベント(イベント6エッジ)、関係(トリプルエッジ)、または他の Clause 間の論理的/談話的関係を表現する Edge タイプである。

RST(Rhetorical Structure Theory)の談話関係に基づいて設計された。

パケット構造(4ワード、64ビット)

1st WORD (16ビット):
┌─────────────────────┬────────────┬────────┐
│      Prefix         │  関係タイプ │  予約   │
│       10ビット       │   4ビット  │  2ビット│
└─────────────────────┴────────────┴────────┘
 [1100 000 010]        [RRRR]       [xx]

2nd WORD: Edge TID (16ビット)
3rd WORD: TID 1 (16ビット) - 第一の節
4th WORD: TID 2 (16ビット) - 第二の節
フィールドビット説明
Prefix101100 000 010
関係タイプ416種の RST 関係
予約2将来拡張用
Edge TID16この Edge の一意識別子
TID 116第一の節の参照
TID 216第二の節の参照

関係タイプ(4ビット = 16種)

因果関係

コードタイプ説明
0000CAUSE原因→結果「雨が降ったので家にいた」
0001RESULT結果←原因「家にいた、雨が降ったから」
0010CONDITION条件→帰結「雨が降れば行かない」
0011PURPOSE目的「生きるために食べる」

時間/順序関係

コードタイプ説明
0100SEQUENCE時間順「ご飯を食べて寝た」
0101PARALLEL同時/並行「笑いながら話した」

対比/譲歩関係

コードタイプ説明
0110CONTRAST対比「Aは大きくBは小さい」
0111CONCESSION譲歩「難しいけどやった」

補足/背景関係

コードタイプ説明
1000ELABORATION詳述「具体的に言えば」
1001BACKGROUND背景情報「ちなみに、当時の状況は」

論証関係

コードタイプ説明
1010EVIDENCE証拠提示「なぜなら…だから」
1011EVALUATION評価「これは良い/悪い」

その他の関係

コードタイプ説明
1100SOLUTIONHOOD問題→解決「問題はX、解決策はY」
1101ALTERNATIVE選択/代替「行くか行かないか」
1110MEANS手段「こうして達成した」
1111RESERVED予約将来拡張用

TID 順序規則

方向は TID 順序で決定される。

関係TID 1TID 2
CAUSE原因結果
RESULT結果原因
CONDITION条件帰結
PURPOSE行為目的
SEQUENCE先行後行
EVIDENCE証拠主張
ELABORATION核心補足

Multinuclear vs Nucleus-Satellite

RST の区分に従う。

Nucleus-Satellite(非対称)

関係TID 1TID 2
CAUSE原因 (Satellite)結果 (Nucleus)
CONDITION条件 (Satellite)帰結 (Nucleus)
EVIDENCE証拠 (Satellite)主張 (Nucleus)
ELABORATION核心 (Nucleus)補足 (Satellite)

Multinuclear(対称)

関係TID 1TID 2
SEQUENCE先行後行
PARALLEL第一第二
CONTRAST第一第二
ALTERNATIVE第一第二

対称関係で TID 順序は意味的優先順位を示さない。

単純因果:「雨が降ったので家にいた」

Verb Edge E01: rain(雨) | TID=0x0001
Verb Edge E02: stay(私, 家) | TID=0x0002

Clause Edge:
  1st: [1100 000 010] [0000] [00]  - Prefix + CAUSE + 予約
  2nd: [0x0100]                    - Edge TID
  3rd: [0x0001]                    - TID 1 (原因: E01)
  4th: [0x0002]                    - TID 2 (結果: E02)

ネスト Clause:「雨が降って家にいたので、勉強した」

Verb Edge E01: rain(雨) | TID=0x0001
Verb Edge E02: stay(私, 家) | TID=0x0002
Verb Edge E03: study(私) | TID=0x0003

Clause Edge C01:
  1st: [1100 000 010] [0000] [00]  - Prefix + CAUSE
  2nd: [0x0100]                    - Edge TID
  3rd: [0x0001]                    - E01
  4th: [0x0002]                    - E02

Clause Edge C02:
  1st: [1100 000 010] [0001] [00]  - Prefix + RESULT
  2nd: [0x0101]                    - Edge TID
  3rd: [0x0100]                    - C01 (Clause TID 参照!)
  4th: [0x0003]                    - E03

設計根拠

RST ベースの理由

  • 30年以上の研究蓄積
  • 多様なコーパスで検証
  • 談話パーシングツールの存在
  • 言語非依存

4ビット(16種)の理由

  • RST 核心関係12種以上をカバー
  • 拡張の余裕を確保
  • 3ビット(8種)では不足

4ワード簡素化の理由

  • 方向:TID 順序で決定(別途ビット不要)
  • 確信度:別途メタデータで処理
  • 2ビット予約:今後の拡張用