A Verdade Desaparece Mais Rapido Que a Velocidade da Luz
Este Exato Momento Ja e o Passado
Agora mesmo, enquanto voce le esta frase, o momento em que esta frase foi escrita ja esta no passado.
A luz que chegou aos seus olhos viajou da tela, levando varios nanossegundos para alcancar sua retina. O sinal da sua retina leva dezenas de milissegundos para viajar pelo nervo optico ate o cerebro. Seu cerebro leva centenas de milissegundos para interpretar esse sinal como uma “frase”.
No momento em que voce sente que “leu” esta frase, o momento em que esta frase existiu na tela ja esta centenas de milhoes de nanossegundos no passado.
Isso nao e uma metafora. Isso e fisica.
A Verdade e Inacessivel
No mundo fisico, um “evento” e um ponto no espaco-tempo.
No momento em que um evento ocorre, ele emite informacao. Fotons, ondas sonoras, ondas gravitacionais, tracos quimicos. Essa informacao se propaga na velocidade da luz ou abaixo dela.
Mas o evento em si? O estado completo no momento e local exatos em que ocorreu?
Ele desaparece no passado mais rapido que a velocidade da luz.
0,001 segundos apos o evento, ele ja esta no passado. Nenhum observador pode acessar o evento “em si”. O que chega ate nos e sempre os tracos que o evento deixou para tras.
Fotons refletidos. Texto registrado. Rumores transmitidos. Dados medidos.
Todos fragmentos. Fragmentos da verdade. Nao a verdade em si.
O Cerebro Nao Armazena Fatos
A neurociencia revelou uma verdade desconfortavel.
A memoria humana nao e gravacao. E reconstrucao.
Quando voce se lembra “eu vi um carro vermelho ontem”, nao existe uma fotografia de um “carro vermelho” armazenada no seu cerebro.
O que realmente acontece e isto:
- Fotons alcancam a retina.
- Celulas cone na retina convertem comprimentos de onda especificos em sinais.
- O cortex visual monta esses sinais em padroes.
- O hipocampo codifica esses padroes junto com o contexto.
- Durante o sono, esses codigos sao reorganizados e comprimidos.
A memoria “eu vi um carro vermelho” e um produto remontado no momento da recuperacao a partir de fragmentos espalhados por multiplas regioes cerebrais.
E por isso que memorias mudam. Cada vez que voce recorda o mesmo evento, ele e reconstruido de forma ligeiramente diferente. Novas experiencias contaminam memorias antigas. Voce pode ate se lembrar de coisas que nunca aconteceram.
O que o cerebro armazena nao sao “fatos”. O que o cerebro armazena e “foi assim que pareceu, foi assim que vi, foi assim que interpretei” — afirmacoes.
Todo Conhecimento Sao Afirmacoes
Estenda esse principio da memoria individual ao conhecimento civilizacional, e a mesma estrutura se repete.
Historia: “Yi Sun-sin morreu na Batalha de Noryang em 1598.”
Isso e um fato?
O que temos: Ha registros nos Anais da Dinastia Joseon. Ha registros nas Obras Completas do Almirante Yi. Ha registros japoneses. Ha seculos de interpretacao academica.
Todos sao afirmacoes. Afirmacoes narradas por diferentes fontes, em diferentes epocas, de diferentes perspectivas.
“Yi Sun-sin morreu em 1598” nao e um fato — e um consenso dessas afirmacoes. Um consenso de confianca muito alta, mas ainda assim um consenso.
Ciencia: “A velocidade da luz e 299.792.458 m/s.”
Isso e um fato?
O que temos: Inumeros experimentos mediram esse valor. A teoria fisica atual prediz esse valor. O Bureau Internacional de Pesos e Medidas adotou esse valor como definicao.
Todos sao afirmacoes. Afirmacoes que passaram pelos limites dos instrumentos de medicao, suposicoes das teorias e procedimentos de consenso. A probabilidade de que uma medicao mais precisa amanha revise esse valor e extremamente baixa, mas em principio nao e zero.
Noticias: “A bolsa caiu 3% hoje.”
Isso e um fato?
E um numero registrado pelo sistema da bolsa. Sob a premissa de que o sistema operou corretamente. Dependendo de qual ponto de referencia define “3%”.
Parece um fato, mas estritamente falando, e uma afirmacao registrada por um sistema especifico sob condicoes especificas.
A Hierarquia da Verdade
Um sistema de conhecimento adequado deve refletir essa realidade epistemologica em seu design.
Se a verdade e inacessivel, entao tudo o que podemos lidar sao afirmacoes sobre a verdade.
Sobre uma colecao de afirmacoes, podemos computar consenso e confianca.
Isso pode ser estruturado em quatro camadas.
L3 — Narracao/Observacao: “Este reporter, neste momento, desta perspectiva, relatou isso.” Os dados mais primitivos. Subjetivos e individuais. Os dados primarios que um sistema de conhecimento lida diretamente.
L2 — Consenso/Visao Estabelecida: “Sintetizando multiplas narracoes, este e o relato mais plausivel.” O resultado de agregar multiplas afirmacoes L3. Probabilistico e provisorio.
L1 — Regras/Leis: “Neste mundo, esta regra opera.” Leis da fisica, regras de jogos, normas sociais. Se violada, o sistema entra em estado de contradicao.
L0 — Matematica/Logica: 1+1=2. As regras das operacoes logicas. Somente isso nao e uma afirmacao. Esta e a regra operacional do motor. Nao dados.
O ponto chave e este:
O ponto de partida e sempre L3 — afirmacoes. As camadas restantes sao derivadas computadas sobre afirmacoes.
Por Que Sistemas Existentes Armazenam Fatos?
Veja o Wikidata.
Q8492 (Yi Sun-sin)
- instancia de: humano
- ocupacao: comandante naval
- data de morte: 1598-12-16
Nao ha “quem fez essa afirmacao”. Nao ha “qual a confianca disso”. Nao ha “existem afirmacoes conflitantes”.
A assercao de que a data de morte de Yi Sun-sin e 16 de dezembro de 1598 e o resultado de consenso entre multiplos registros historicos e academicos, mas o Wikidata armazena isso como se fosse uma verdade universal.
Na maioria dos casos, isso nao e um problema. Porque a confianca do consenso e suficientemente alta.
Mas considere estas situacoes:
Dois veiculos de noticias publicam relatos conflitantes sobre o mesmo evento. Um historiador apresenta uma nova interpretacao que contradiz a visao estabelecida. Um artigo cientifico falha em reproduzir resultados experimentais existentes.
Em um sistema que armazena “fatos”, isso e um erro. Um deles esta errado. Deve ser corrigido.
Em um sistema que armazena “afirmacoes”, isso e normal. Diferentes fontes, de diferentes perspectivas, fizeram diferentes afirmacoes. Ambas as afirmacoes sao registradas. Consenso e confianca sao computados sobre elas.
A realidade nao e limpa. Contradicao faz parte da realidade. Um sistema que trata contradicao como erro nao pode conter a realidade.
A Origem Fisica da Alucinacao
Vamos revisitar o problema de alucinacao dos LLMs sob essa perspectiva.
LLMs sao treinados com bilhoes de frases. Cada frase e uma afirmacao escrita por alguem em algum contexto.
Mas LLMs aprendem isso nao como “afirmacoes” mas como “fatos sobre o mundo”.
Fontes desaparecem. Contexto desaparece. Confianca desaparece. Perspectivas desaparecem.
O que resta sao apenas padroes estatisticos.
Entao um LLM nao consegue distinguir entre “Yi Sun-sin morreu em 1598” e “Yi Sun-sin gostava de expressoes de quatro caracteres.” Ambas as frases podem aparecer com alta probabilidade nos dados de treinamento, e sem informacao de fonte, nao ha como saber que uma e uma narracao historica estabelecida e a outra e uma afirmacao inexistente.
Essa e a origem fisica da alucinacao.
Quando fragmentos da verdade perdem suas fontes e se misturam, “fatos” inexistentes sao fabricados.
A solucao e clara. Tratar fragmentos como fragmentos. Registrar afirmacoes como afirmacoes. Preservar estruturalmente fontes, contexto e confianca.
Uma Solucao Estrutural
Um sistema de conhecimento adequado deve tratar cada narracao como uma afirmacao.
Quando uma frase em linguagem natural e convertida em uma representacao estruturada, deve incluir:
Quem fez a afirmacao — Entidade fonte Quando foi afirmado — Contexto temporal Em qual mundo esta essa afirmacao — Contexto de mundo De qual perspectiva — POV (Ponto de Vista) Qual a confianca — Nivel de confianca
Isso nao e opcional. A estrutura de tal sistema exige essa informacao. Se um campo esta vazio, ele e explicitamente marcado como vazio.
Quando “Yi Sun-sin foi grande” e convertido em uma representacao estruturada:
[Entidade: Yi Sun-sin]
[Verbo: ser grande (verbo avaliativo)]
[POV: Falante (participante da conversa atual)]
[Tempo: Momento presente]
[Confianca: Nao especificada]
[Fonte: Pronunciamento direto do falante]
[Mundo: Mundo real]
Mesmo para a frase identica em linguagem natural “Yi Sun-sin foi grande”, a representacao e inteiramente diferente dependendo de ser narrada por um livro didatico de historia, falada como impressao pessoal de um individuo, ou dita por um personagem em um romance.
A ambiguidade e estruturalmente eliminada. Afirmacoes sao registradas como afirmacoes. Fragmentos da verdade sao preservados como fragmentos.
O Mapa Nao e o Territorio
O academico polones-americano Alfred Korzybski disse:
“O mapa nao e o territorio.”
O que precisamos e uma linguagem para desenhar mapas. Um motor que coleta mapas e faz engenharia reversa do territorio.
Um mapa nao e uma replica perfeita do territorio. Um mapa e uma representacao desenhada por alguem, para algum proposito, em alguma escala. Pode haver dezenas de mapas da mesma cidade. Mapas turisticos, mapas topograficos, mapas de transporte, mapas de densidade populacional. Todos sao diferentes afirmacoes sobre o mesmo territorio.
Nenhum mapa e o territorio em si. Mas ao sobrepor multiplos mapas, nossa compreensao do territorio se aprofunda.
E assim que um sistema de conhecimento baseado em afirmacoes lida com o mundo. Ele registra inumeras afirmacoes em forma estruturada, descobre consenso e padroes sobre elas, e constroi uma compreensao cada vez mais precisa do territorio.
Mas ele nunca afirma, “Isso e o territorio em si.”
Resumo
A verdade e fisicamente inacessivel.
- Eventos desaparecem no passado no momento em que ocorrem. Mais rapido que a velocidade da luz.
- Tudo que resta sao fragmentos da verdade. Fotons, registros, testemunhos.
- Mesmo o cerebro nao armazena fatos. Ele armazena afirmacoes reconstruidas a partir de fragmentos.
- Portanto, os dados primarios de um sistema de conhecimento nao podem ser fatos. Devem ser afirmacoes.
- Se voce trata afirmacoes como fatos, contradicao se torna erro. Se voce as trata como afirmacoes, contradicao se torna dado.
- Alucinacao de LLM e o resultado de afirmacoes perdendo suas fontes.
- Tal sistema estruturalmente incorpora fonte, tempo, perspectiva e confianca em cada narracao.
Nos nao lidamos com a verdade. Nos lidamos com frases sobre a verdade. Isso nao e humildade. Isso e fisica.