Clause Edge est un type d’Edge qui exprime les relations logiques et discursives entre predications (Verb Edge), evenements (Event6 Edge), relations (Triple Edge) ou d’autres Clause.

Il est concu sur la base des relations discursives de la RST (Rhetorical Structure Theory).

Structure du paquet (4 mots, 64 bits)

1st WORD (16 bits):
┌─────────────────────┬────────────┬────────┐
│      Prefix         │ Type rel.  │ Reserv.│
│       10 bits       │   4 bits   │ 2 bits │
└─────────────────────┴────────────┴────────┘
 [1100 000 010]        [RRRR]       [xx]

2nd WORD: Edge TID (16 bits)
3rd WORD: TID 1 (16 bits) - premiere clause
4th WORD: TID 2 (16 bits) - deuxieme clause
ChampBitsDescription
Prefix101100 000 010
Type de relation416 relations RST
Reserve2Pour extension future
Edge TID16Identifiant unique de cet Edge
TID 116Reference a la premiere clause
TID 216Reference a la deuxieme clause

Types de relations (4 bits = 16)

Relations causales

CodeTypeDescriptionExemple
0000CAUSECause→Effet“Comme il pleuvait, je suis reste a la maison”
0001RESULTEffet←Cause“Je suis reste a la maison, car il pleuvait”
0010CONDITIONCondition→Consequence“S’il pleut, je n’irai pas”
0011PURPOSEBut“On mange pour vivre”

Relations temporelles/sequentielles

CodeTypeDescriptionExemple
0100SEQUENCEOrdre chronologique“J’ai mange puis dormi”
0101PARALLELSimultanee/Parallele“Il parlait en souriant”

Relations de contraste/concession

CodeTypeDescriptionExemple
0110CONTRASTContraste“A est grand et B est petit”
0111CONCESSIONConcession“Bien que ce fut difficile, il l’a fait”

Relations d’elaboration/arriere-plan

CodeTypeDescriptionExemple
1000ELABORATIONDeveloppement“Plus precisement…”
1001BACKGROUNDInformation de fond“Pour reference, la situation etait…”

Relations argumentatives

CodeTypeDescriptionExemple
1010EVIDENCEPresentation de preuves“Parce que… c’est pour cela”
1011EVALUATIONEvaluation“Ceci est bon/mauvais”

Autres relations

CodeTypeDescriptionExemple
1100SOLUTIONHOODProbleme→Solution“Le probleme est X, la solution est Y”
1101ALTERNATIVEChoix/Alternative“Partir ou ne pas partir”
1110MEANSMoyen“C’est ainsi qu’il y est parvenu”
1111RESERVEDReservePour extension future

Regle d’ordre des TID

La direction est determinee par l’ordre des TID.

RelationTID 1TID 2
CAUSECauseEffet
RESULTEffetCause
CONDITIONConditionConsequence
PURPOSEActionBut
SEQUENCEPrecedentSuivant
EVIDENCEPreuveAffirmation
ELABORATIONEssentielDeveloppement

Multinuclear vs Nucleus-Satellite

Selon la distinction RST.

Nucleus-Satellite (asymetrique)

RelationTID 1TID 2
CAUSECause (Satellite)Effet (Nucleus)
CONDITIONCondition (Satellite)Consequence (Nucleus)
EVIDENCEPreuve (Satellite)Affirmation (Nucleus)
ELABORATIONEssentiel (Nucleus)Developpement (Satellite)

Multinuclear (symetrique)

RelationTID 1TID 2
SEQUENCEPrecedentSuivant
PARALLELPremierDeuxieme
CONTRASTPremierDeuxieme
ALTERNATIVEPremierDeuxieme

Dans les relations symetriques, l’ordre des TID n’indique pas de priorite semantique.

Exemples

Causalite simple : “Comme il pleuvait, je suis reste a la maison”

Verb Edge E01: rain(pluie) | TID=0x0001
Verb Edge E02: stay(moi, maison) | TID=0x0002

Clause Edge:
  1st: [1100 000 010] [0000] [00]  - Prefix + CAUSE + Reserve
  2nd: [0x0100]                    - Edge TID
  3rd: [0x0001]                    - TID 1 (cause: E01)
  4th: [0x0002]                    - TID 2 (effet: E02)

Clause imbriquee : “Comme il pleuvait, je suis reste a la maison, et donc j’ai etudie”

Verb Edge E01: rain(pluie) | TID=0x0001
Verb Edge E02: stay(moi, maison) | TID=0x0002
Verb Edge E03: study(moi) | TID=0x0003

Clause Edge C01:
  1st: [1100 000 010] [0000] [00]  - Prefix + CAUSE
  2nd: [0x0100]                    - Edge TID
  3rd: [0x0001]                    - E01
  4th: [0x0002]                    - E02

Clause Edge C02:
  1st: [1100 000 010] [0001] [00]  - Prefix + RESULT
  2nd: [0x0101]                    - Edge TID
  3rd: [0x0100]                    - C01 (reference au TID de Clause !)
  4th: [0x0003]                    - E03

Justification de conception

Pourquoi la RST

  • Plus de 30 ans de recherche accumulee
  • Validation sur divers corpus
  • Outils d’analyse du discours existants
  • Independant de la langue

Pourquoi 4 bits (16)

  • Couvre plus de 12 relations RST essentielles
  • Marge d’extension conservee
  • 3 bits (8) seraient insuffisants

Pourquoi 4 mots simplifies

  • Direction : determinee par l’ordre des TID (pas de bit supplementaire necessaire)
  • Certitude : traitee comme metadonnees separees
  • 2 bits reserves : pour extension future