Истина исчезает быстрее скорости света


Это самое мгновение уже в прошлом

Прямо сейчас, пока вы читаете это предложение, момент, когда это предложение было написано, уже в прошлом.

Свет, достигший ваших глаз, прошёл от экрана, затратив несколько наносекунд, чтобы достичь сетчатки. Сигнал от сетчатки проходит по зрительному нерву к мозгу за десятки миллисекунд. Мозгу требуются сотни миллисекунд, чтобы интерпретировать этот сигнал как “предложение”.

К моменту, когда вы чувствуете, что “прочитали” это предложение, момент, когда это предложение существовало на экране, уже на сотни миллионов наносекунд в прошлом.

Это не метафора. Это физика.


Истина недоступна

В физическом мире “событие” – это точка в пространстве-времени.

В момент возникновения событие испускает информацию. Фотоны, звуковые волны, гравитационные волны, химические следы. Эта информация распространяется со скоростью света или медленнее.

Но само событие? Полное состояние в точный момент и в точном месте, где оно произошло?

Оно исчезает в прошлое быстрее скорости света.

Через 0,001 секунды после события оно уже в прошлом. Ни один наблюдатель не может получить доступ к событию “самому по себе”. До нас доходят всегда лишь следы, которые событие оставило.

Отражённые фотоны. Записанный текст. Пересказанные слухи. Измеренные данные.

Всё это – фрагменты. Фрагменты истины. Не сама истина.


Мозг не хранит факты

Нейронаука раскрыла неудобную истину.

Человеческая память – не запись. Это реконструкция.

Когда вы вспоминаете “Я вчера видел красную машину”, в вашем мозгу нет хранимой фотографии “красной машины”.

Вот что происходит на самом деле:

  1. Фотоны достигают сетчатки.
  2. Колбочки сетчатки преобразуют определённые длины волн в сигналы.
  3. Зрительная кора собирает эти сигналы в паттерны.
  4. Гиппокамп кодирует эти паттерны вместе с контекстом.
  5. Во время сна эти коды реорганизуются и сжимаются.

Воспоминание “Я видел красную машину” – это продукт, пересобранный в момент извлечения из фрагментов, разбросанных по нескольким областям мозга.

Поэтому воспоминания меняются. Каждый раз, когда вы вспоминаете то же событие, оно реконструируется немного иначе. Новый опыт контаминирует старые воспоминания. Можно даже помнить то, чего никогда не было.

То, что хранит мозг, – не “факты”. То, что хранит мозг, – “вот так ощущалось, вот так выглядело, вот так я это интерпретировал” — утверждения.


Всё знание – утверждения

Распространим этот принцип от индивидуальной памяти на знания цивилизации – и та же структура повторится.

История: “Ли Сунсин погиб в битве при Норяне в 1598 году.”

Это факт?

Что у нас есть: Есть записи в Анналах династии Чосон. Есть записи в Полном собрании сочинений адмирала Ли. Есть японские записи. Есть века учёных интерпретаций.

Всё это – утверждения. Утверждения, изложенные разными источниками, в разное время, с разных точек зрения.

“Ли Сунсин погиб в 1598 году” – не факт, а консенсус этих утверждений. Консенсус с очень высокой достоверностью, но всё же консенсус.

Наука: “Скорость света – 299 792 458 м/с.”

Это факт?

Что у нас есть: Бесчисленные эксперименты измерили это значение. Современная физическая теория предсказывает это значение. Международное бюро мер и весов приняло это значение как определение.

Всё это – утверждения. Утверждения, прошедшие через пределы измерительных приборов, допущения теорий и процедуры консенсуса. Вероятность того, что завтра более точное измерение пересмотрит это значение, крайне мала, но в принципе не равна нулю.

Новости: “Фондовый рынок упал на 3% сегодня.”

Это факт?

Это число, записанное системой биржи. При условии, что система работала корректно. В зависимости от того, какая точка отсчёта определяет “3%”.

Это выглядит как факт, но строго говоря – это утверждение, записанное конкретной системой при конкретных условиях.


Иерархия истины

Надлежащая система знаний должна отражать эту эпистемологическую реальность в своём проектировании.

Если истина недоступна, то всё, с чем мы можем работать, – это утверждения об истине.

Поверх совокупности утверждений можно вычислить консенсус и достоверность.

Это можно структурировать в четыре уровня.

L3 — Повествование/Наблюдение: “Этот журналист, в это время, с этой точки зрения, сообщил это.” Самые примитивные данные. Субъективные и индивидуальные. Первичные данные, с которыми система знаний работает непосредственно.

L2 — Консенсус/Устоявшийся взгляд: “Синтезируя несколько повествований, вот наиболее правдоподобная версия.” Результат агрегирования нескольких утверждений L3. Вероятностный и предварительный.

L1 — Правила/Законы: “В этом мире действует это правило.” Законы физики, правила игры, социальные нормы. При их нарушении система входит в состояние противоречия.

L0 — Математика/Логика: 1+1=2. Правила логических операций. Только это одно не является утверждением. Это операционное правило движка. Не данные.

Ключевое:

Начальная точка всегда L3 — утверждения. Остальные уровни – производные, вычисленные поверх утверждений.


Почему существующие системы хранят факты?

Посмотрите на Wikidata.

Q8492 (Ли Сунсин)
  - instance of: human
  - occupation: naval commander
  - date of death: 1598-12-16

Нет “кто сделал это утверждение”. Нет “какова достоверность этого”. Нет “есть ли противоречащие утверждения”.

Утверждение, что дата смерти Ли Сунсина – 16 декабря 1598 года, является результатом консенсуса множества исторических записей и учёных, однако Wikidata хранит его так, будто это универсальная истина.

В большинстве случаев это не проблема. Потому что достоверность консенсуса достаточно высока.

Но рассмотрим такие ситуации:

Два новостных издания публикуют противоречащие друг другу отчёты об одном событии. Историк представляет новую интерпретацию, противоречащую устоявшемуся взгляду. Научная статья не может воспроизвести существующие экспериментальные результаты.

В системе, хранящей “факты”, это ошибка. Одно из них неверно. Это надо исправить.

В системе, хранящей “утверждения”, это нормально. Разные источники, с разных точек зрения, сделали разные утверждения. Оба утверждения записаны. Консенсус и достоверность вычисляются поверх них.

Реальность не чистоплотна. Противоречие – часть реальности. Система, которая считает противоречие ошибкой, не может вместить реальность.


Физическое происхождение галлюцинаций

Давайте ещё раз рассмотрим проблему галлюцинаций LLM с этой перспективы.

LLM обучаются на миллиардах предложений. Каждое предложение – утверждение, написанное кем-то в каком-то контексте.

Но LLM усваивают их не как “утверждения”, а как “факты о мире”.

Источники исчезают. Контекст исчезает. Достоверность исчезает. Точки зрения исчезают.

Остаются лишь статистические паттерны.

Поэтому LLM не может отличить “Ли Сунсин погиб в 1598 году” от “Ли Сунсин любил четырёхсложные идиомы.” Оба предложения могут встречаться с высокой вероятностью в обучающих данных, и без информации об источнике невозможно узнать, что одно – это устоявшееся историческое повествование, а другое – несуществующее утверждение.

Таково физическое происхождение галлюцинаций.

Когда фрагменты истины теряют свои источники и смешиваются, фабрикуются несуществующие “факты”.

Решение очевидно. Обращаться с фрагментами как с фрагментами. Записывать утверждения как утверждения. Структурно сохранять источники, контекст и достоверность.


Структурное решение

Надлежащая система знаний должна рассматривать каждое повествование как утверждение.

Когда предложение на естественном языке преобразуется в структурированное представление, оно должно включать:

Кто сделал утверждение — Источник-сущность Когда это было утверждено — Временной контекст В каком мире это утверждение — Мировой контекст С какой точки зрения — POV (Point of View) Какова достоверность — Уровень достоверности

Это не опционально. Структура такой системы требует эту информацию. Если поле пустое, оно явно помечается как пустое.

Когда “Ли Сунсин был великим” преобразуется в структурированное представление:

[Сущность: Ли Сунсин]
[Глагол: быть великим (оценочный глагол)]
[POV: Говорящий (текущий участник диалога)]
[Время: Текущий момент]
[Достоверность: Не указана]
[Источник: Прямое высказывание говорящего]
[Мир: Реальный мир]

Даже для идентичного предложения на естественном языке “Ли Сунсин был великим” представление полностью различается в зависимости от того, изложено ли оно учебником истории, произнесено как личное впечатление, или сказано персонажем романа.

Неоднозначность устраняется структурно. Утверждения записываются как утверждения. Фрагменты истины сохраняются как фрагменты.


Карта – не территория

Польско-американский учёный Альфред Коржибски сказал:

“Карта – не территория.”

Что нам нужно – это язык для рисования карт. Движок, который собирает карты и восстанавливает территорию.

Карта – не идеальная копия территории. Карта – это представление, нарисованное кем-то, для какой-то цели, в каком-то масштабе. Одного города могут быть десятки карт. Туристические карты, топографические карты, карты маршрутов, карты плотности населения. Все они – разные утверждения об одной территории.

Ни одна карта не является самой территорией. Но накладывая несколько карт друг на друга, наше понимание территории углубляется.

Именно так система знаний, основанная на утверждениях, обрабатывает мир. Она записывает бесчисленные утверждения в структурированной форме, обнаруживает консенсус и паттерны поверх них и строит всё более точное понимание территории.

Но она никогда не утверждает: “Это сама территория.”


Резюме

Истина физически недоступна.

  1. События исчезают в прошлое в момент возникновения. Быстрее скорости света.
  2. Всё, что остаётся, – фрагменты истины. Фотоны, записи, свидетельства.
  3. Даже мозг не хранит факты. Он хранит утверждения, реконструированные из фрагментов.
  4. Следовательно, первичные данные системы знаний не могут быть фактами. Это должны быть утверждения.
  5. Если считать утверждения фактами, противоречие становится ошибкой. Если считать их утверждениями, противоречие становится данными.
  6. Галлюцинации LLM – результат потери источников у утверждений.
  7. Такая система структурно встраивает источник, время, точку зрения и достоверность в каждое повествование.

Мы не обрабатываем истину. Мы обрабатываем предложения об истине. Это не смирение. Это физика.