Clause Edge es un tipo de Edge que expresa relaciones lógicas/discursivas entre predicados (Verb Edge), eventos (Event6 Edge), relaciones (Triple Edge) u otros Clauses.

Diseñado basándose en las relaciones discursivas de RST (Rhetorical Structure Theory).

Estructura de paquete (4 palabras, 64 bits)

1st WORD (16 bits):
┌─────────────────────┬────────────┬────────┐
│      Prefix         │ Tipo rel.  │ Reserv.│
│       10 bits       │   4 bits   │ 2 bits │
└─────────────────────┴────────────┴────────┘
 [1100 000 010]        [RRRR]       [xx]

2nd WORD: Edge TID (16 bits)
3rd WORD: TID 1 (16 bits) - primera cláusula
4th WORD: TID 2 (16 bits) - segunda cláusula
CampoBitsDescripción
Prefix101100 000 010
Tipo de relación416 relaciones RST
Reservado2Para extensión futura
Edge TID16Identificador único de este Edge
TID 116Referencia a la primera cláusula
TID 216Referencia a la segunda cláusula

Tipos de relación (4 bits = 16)

Relaciones causales

CódigoTipoDescripciónEjemplo
0000CAUSECausa→resultado“Llovió, así que me quedé en casa”
0001RESULTResultado←causa“Me quedé en casa, porque llovió”
0010CONDITIONCondición→consecuencia“Si llueve, no voy”
0011PURPOSEPropósito“Come para vivir”

Relaciones temporales/secuenciales

CódigoTipoDescripciónEjemplo
0100SEQUENCEOrden cronológico“Comió y luego durmió”
0101PARALLELSimultáneo/paralelo“Habló sonriendo”

Relaciones de contraste/concesión

CódigoTipoDescripciónEjemplo
0110CONTRASTContraste“A es grande y B es pequeño”
0111CONCESSIONConcesión“Aunque fue difícil, lo hizo”

Relaciones de elaboración/fondo

CódigoTipoDescripciónEjemplo
1000ELABORATIONDetalle“Concretamente hablando”
1001BACKGROUNDInformación de fondo“Como referencia, en aquel entonces”

Relaciones argumentativas

CódigoTipoDescripciónEjemplo
1010EVIDENCEPresentación de evidencia“Porque… por eso”
1011EVALUATIONEvaluación“Esto es bueno/malo”

Otras relaciones

CódigoTipoDescripciónEjemplo
1100SOLUTIONHOODProblema→solución“El problema es X, la solución es Y”
1101ALTERNATIVEElección/alternativa“Ir o no ir”
1110MEANSMedio“Lo logró haciendo así”
1111RESERVEDReservadoPara extensión futura

Reglas de orden de TID

La dirección se determina por el orden de los TID.

RelaciónTID 1TID 2
CAUSECausaResultado
RESULTResultadoCausa
CONDITIONCondiciónConsecuencia
PURPOSEAcciónPropósito
SEQUENCEAnteriorPosterior
EVIDENCEEvidenciaAfirmación
ELABORATIONNúcleoDetalle

Multinuclear vs Nucleus-Satellite

Sigue la distinción de RST.

Nucleus-Satellite (asimétrico)

RelaciónTID 1TID 2
CAUSECausa (Satellite)Resultado (Nucleus)
CONDITIONCondición (Satellite)Consecuencia (Nucleus)
EVIDENCEEvidencia (Satellite)Afirmación (Nucleus)
ELABORATIONNúcleo (Nucleus)Detalle (Satellite)

Multinuclear (simétrico)

RelaciónTID 1TID 2
SEQUENCEAnteriorPosterior
PARALLELPrimeroSegundo
CONTRASTPrimeroSegundo
ALTERNATIVEPrimeroSegundo

En las relaciones simétricas, el orden de TID no indica prioridad semántica.

Ejemplos

Causalidad simple: “Llovió, así que me quedé en casa”

Verb Edge E01: rain(lluvia) | TID=0x0001
Verb Edge E02: stay(yo, casa) | TID=0x0002

Clause Edge:
  1st: [1100 000 010] [0000] [00]  - Prefix + CAUSE + Reservado
  2nd: [0x0100]                    - Edge TID
  3rd: [0x0001]                    - TID 1 (causa: E01)
  4th: [0x0002]                    - TID 2 (resultado: E02)

Clause anidado: “Llovió, así que me quedé en casa, y por eso estudié”

Verb Edge E01: rain(lluvia) | TID=0x0001
Verb Edge E02: stay(yo, casa) | TID=0x0002
Verb Edge E03: study(yo) | TID=0x0003

Clause Edge C01:
  1st: [1100 000 010] [0000] [00]  - Prefix + CAUSE
  2nd: [0x0100]                    - Edge TID
  3rd: [0x0001]                    - E01
  4th: [0x0002]                    - E02

Clause Edge C02:
  1st: [1100 000 010] [0001] [00]  - Prefix + RESULT
  2nd: [0x0101]                    - Edge TID
  3rd: [0x0100]                    - C01 (referencia TID de Clause)
  4th: [0x0003]                    - E03

Fundamento del diseño

Por qué basarse en RST

  • Más de 30 anos de investigacion acumulada
  • Verificado con diversos corpus
  • Existen herramientas de parsing discursivo
  • Independiente del idioma

Por qué 4 bits (16 tipos)

  • Cubre 12 o mas relaciones nucleares de RST
  • Margen para extension
  • 3 bits (8 tipos) es insuficiente

Por qué simplificar a 4 palabras

  • Dirección: se determina por orden de TID (no necesita bits adicionales)
  • Confianza: se maneja como metadatos separados
  • 2 bits reservados: para extensión futura