Clause Edge é um tipo de Edge que expressa relações lógicas/discursivas entre predicados (Verb Edge), eventos (Event6 Edge), relações (Triple Edge) ou outros Clauses.

Concebido com base nas relações discursivas da RST (Rhetorical Structure Theory).

Estrutura do pacote (4 palavras, 64 bits)

1st WORD (16 bits):
┌─────────────────────┬────────────┬────────┐
│      Prefix         │ Tipo rel.  │ Reserv.│
│       10 bits       │   4 bits   │ 2 bits │
└─────────────────────┴────────────┴────────┘
 [1100 000 010]        [RRRR]       [xx]

2nd WORD: Edge TID (16 bits)
3rd WORD: TID 1 (16 bits) - primeira cláusula
4th WORD: TID 2 (16 bits) - segunda cláusula
CampoBitsDescrição
Prefix101100 000 010
Tipo de relação416 relações RST
Reservado2Para extensão futura
Edge TID16Identificador único deste Edge
TID 116Referência à primeira cláusula
TID 216Referência à segunda cláusula

Tipos de relação (4 bits = 16)

Relações causais

CódigoTipoDescriçãoExemplo
0000CAUSECausa→resultado“Choveu, por isso fiquei em casa”
0001RESULTResultado←causa“Fiquei em casa, porque choveu”
0010CONDITIONCondição→consequência“Se chover, não vou”
0011PURPOSEPropósito“Come para viver”

Relações temporais/sequenciais

CódigoTipoDescriçãoExemplo
0100SEQUENCEOrdem cronológica“Comeu e depois dormiu”
0101PARALLELSimultâneo/paralelo“Falou sorrindo”

Relações de contraste/concessão

CódigoTipoDescriçãoExemplo
0110CONTRASTContraste“A é grande e B é pequeno”
0111CONCESSIONConcessão“Embora fosse difícil, fez”

Relações de elaboração/fundo

CódigoTipoDescriçãoExemplo
1000ELABORATIONDetalhe“Concretamente falando”
1001BACKGROUNDInformação de fundo“Para referência, naquela altura”

Relações argumentativas

CódigoTipoDescriçãoExemplo
1010EVIDENCEApresentação de evidência“Porque… por isso”
1011EVALUATIONAvaliação“Isto é bom/mau”

Outras relações

CódigoTipoDescriçãoExemplo
1100SOLUTIONHOODProblema→solução“O problema é X, a solução é Y”
1101ALTERNATIVEEscolha/alternativa“Ir ou não ir”
1110MEANSMeio“Conseguiu fazendo assim”
1111RESERVEDReservadoPara extensão futura

Regras de ordem de TID

A direção é determinada pela ordem dos TIDs.

RelaçãoTID 1TID 2
CAUSECausaResultado
RESULTResultadoCausa
CONDITIONCondiçãoConsequência
PURPOSEAçãoPropósito
SEQUENCEAnteriorPosterior
EVIDENCEEvidênciaAfirmação
ELABORATIONNúcleoDetalhe

Multinuclear vs Nucleus-Satellite

Segue a distinção da RST.

Nucleus-Satellite (assimétrico)

RelaçãoTID 1TID 2
CAUSECausa (Satellite)Resultado (Nucleus)
CONDITIONCondição (Satellite)Consequência (Nucleus)
EVIDENCEEvidência (Satellite)Afirmação (Nucleus)
ELABORATIONNúcleo (Nucleus)Detalhe (Satellite)

Multinuclear (simétrico)

RelaçãoTID 1TID 2
SEQUENCEAnteriorPosterior
PARALLELPrimeiroSegundo
CONTRASTPrimeiroSegundo
ALTERNATIVEPrimeiroSegundo

Nas relações simétricas, a ordem dos TIDs não indica prioridade semântica.

Exemplos

Causalidade simples: “Choveu, por isso fiquei em casa”

Verb Edge E01: rain(chuva) | TID=0x0001
Verb Edge E02: stay(eu, casa) | TID=0x0002

Clause Edge:
  1st: [1100 000 010] [0000] [00]  - Prefix + CAUSE + Reservado
  2nd: [0x0100]                    - Edge TID
  3rd: [0x0001]                    - TID 1 (causa: E01)
  4th: [0x0002]                    - TID 2 (resultado: E02)

Clause aninhado: “Choveu, por isso fiquei em casa, e por isso estudei”

Verb Edge E01: rain(chuva) | TID=0x0001
Verb Edge E02: stay(eu, casa) | TID=0x0002
Verb Edge E03: study(eu) | TID=0x0003

Clause Edge C01:
  1st: [1100 000 010] [0000] [00]  - Prefix + CAUSE
  2nd: [0x0100]                    - Edge TID
  3rd: [0x0001]                    - E01
  4th: [0x0002]                    - E02

Clause Edge C02:
  1st: [1100 000 010] [0001] [00]  - Prefix + RESULT
  2nd: [0x0101]                    - Edge TID
  3rd: [0x0100]                    - C01 (referência TID de Clause)
  4th: [0x0003]                    - E03

Fundamento do design

Por que basear-se em RST

  • Mais de 30 anos de investigação acumulada
  • Verificado com diversos corpora
  • Existem ferramentas de parsing discursivo
  • Independente do idioma

Por que 4 bits (16 tipos)

  • Cobre 12 ou mais relações nucleares da RST
  • Margem para extensão
  • 3 bits (8 tipos) é insuficiente

Por que simplificar para 4 palavras

  • Direção: determina-se pela ordem dos TIDs (não precisa de bits adicionais)
  • Confiança: trata-se como metadados separados
  • 2 bits reservados: para extensão futura