真実は光速より速く消え去る
この瞬間はすでに過去
今この瞬間、あなたがこの文を読んでいるとき、 この文が書かれた瞬間はすでに過去だ。
あなたの目に届いた光はスクリーンから出発し、 網膜に到達するのに数ナノ秒かかった。 網膜からの信号が視神経を通って脳に届くのに数十ミリ秒かかる。 脳がその信号を「文」として解釈するのに数百ミリ秒かかる。
この文を「読んだ」と感じた瞬間には、 この文がスクリーンに存在していた瞬間は すでに数億ナノ秒の過去になっている。
これは比喩ではない。 これは物理学だ。
真実は到達不能
物理的世界において、「出来事」は時空の一点だ。
出来事が発生した瞬間、それは情報を放出する。 光子、音波、重力波、化学的痕跡。 この情報は光速以下で伝播する。
しかし出来事そのもの? それが発生した正確な時間と場所における完全な状態?
光速より速く過去に消え去る。
出来事の0.001秒後、それはすでに過去だ。 いかなる観測者も出来事「そのもの」にアクセスすることはできない。 私たちに届くのは常に 出来事が残した痕跡だ。
反射した光子。 記録されたテキスト。 伝聞された噂。 計測されたデータ。
すべて断片だ。 真実の断片。真実そのものではない。
脳は事実を格納しない
神経科学が不都合な真実を明らかにした。
人間の記憶は録画ではない。再構成だ。
「昨日赤い車を見た」と思い出すとき、 脳のどこかに「赤い車」の写真が保存されているわけではない。
実際に起こっていることはこうだ:
- 光子が網膜に到達する。
- 網膜の錐体細胞が特定の波長を信号に変換する。
- 視覚皮質がこれらの信号をパターンに組み立てる。
- 海馬がこれらのパターンをコンテキストとともに符号化する。
- 睡眠中にこれらのコードが再編成され圧縮される。
「赤い車を見た」という記憶は、 取り出しの瞬間に 複数の脳領域に散らばった断片から再組み立てされた産物だ。
だから記憶は変化する。 同じ出来事を思い出すたびに、わずかに異なる形で再構成される。 新しい経験が古い記憶を汚染する。 起こってもいないことを記憶することすらある。
脳が格納しているのは「事実」ではない。 脳が格納しているのは 「こう感じた、こう見えた、こう解釈した」—— 主張だ。
すべての知識は主張である
この原則を個人の記憶から文明の知識に拡張すると、 同じ構造が繰り返される。
歴史: 「李舜臣は1598年の露梁海戦で戦死した。」
これは事実か?
私たちが持っているもの: 朝鮮王朝実録の記録がある。 李忠武公全書の記録がある。 日本側の記録がある。 数百年にわたる学術的解釈がある。
すべて主張だ。 異なる出所が、異なる時代に、異なる視点から語った主張。
「李舜臣は1598年に戦死した」は事実ではない—— これら主張の合意だ。 確信度が非常に高い合意ではあるが、それでも合意だ。
科学: 「光の速度は299,792,458 m/sである。」
これは事実か?
私たちが持っているもの: 無数の実験がこの値を測定した。 現在の物理理論がこの値を予測する。 国際度量衡局がこの値を定義として採用した。
すべて主張だ。 測定器の限界、理論の仮定、合意手続きを通過した主張。 明日のより精密な測定がこの値を修正する確率は 極めて低いが、原理的にゼロではない。
ニュース: 「今日の株式市場は3%下落した。」
これは事実か?
取引所のシステムが記録した数字だ。 システムが正常に動作したという前提のもとに。 「3%」がどの基準点で定義されるかに依存する。
事実のように見えるが、厳密に言えば、 特定の条件下で特定のシステムが記録した主張だ。
真実の階層
まともな知識システムは、この認識論的現実を設計に反映しなければならない。
真実が到達不能であれば、 私たちが扱えるのは真実についての主張だけだ。
主張の集合の上に、 合意と確信度を計算できる。
これは4つの層に構造化できる。
L3——語り/観測: 「このジャーナリストが、この時間に、この視点から、これを報じた。」 最も原始的なデータ。主観的で個人的。 知識システムが直接扱う一次データ。
L2——合意/定説: 「複数の語りを総合すると、これが最も妥当な説明だ。」 複数のL3主張を集約した結果。 確率的で暫定的。
L1——規則/法則: 「この世界では、この規則が作用する。」 物理法則、ゲームルール、社会規範。 破られると、システムは矛盾状態に入る。
L0——数学/論理: 1+1=2。論理演算の規則。 これだけが唯一、主張ではない。 これはエンジンの動作規則だ。データではない。
要点はこうだ:
出発点は常にL3——主張だ。 残りの層は主張の上に計算された派生物だ。
なぜ既存のシステムは事実を格納するのか?
Wikidataを見てみよう。
Q8492 (李舜臣)
- instance of: human
- occupation: naval commander
- date of death: 1598-12-16
「誰がこの主張をしたか」がない。 「確信度はどの程度か」がない。 「矛盾する主張はあるか」がない。
李舜臣の死亡日が1598年12月16日であるという断言は 複数の歴史記録と学者間の合意の結果だが、 Wikidataはこれを普遍的真実として格納している。
ほとんどの場合、これは問題にならない。 合意の確信度が十分に高いからだ。
しかしこのような状況を考えてみよう:
二つの報道機関が同じ出来事について矛盾する報道を発表する。 歴史学者が定説に反する新しい解釈を提示する。 科学論文が既存の実験結果を再現できない。
「事実」を格納するシステムでは、これはエラーだ。 どちらかが間違っている。修正しなければならない。
「主張」を格納するシステムでは、これは正常だ。 異なる出所が、異なる視点から、異なる主張をした。 両方の主張が記録される。 合意と確信度がその上で計算される。
現実はきれいではない。 矛盾は現実の一部だ。 矛盾をエラーとして扱うシステムは現実を包含できない。
幻覚の物理的起源
LLMの幻覚問題をこの視点から再考してみよう。
LLMは数十億の文で訓練される。 各文は誰かが何らかの文脈で書いた主張だ。
しかしLLMはこれらを「主張」としてではなく 「世界についての事実」として学習する。
出所が消える。 文脈が消える。 確信度が消える。 視点が消える。
残るのは統計的パターンだけだ。
だからLLMは 「李舜臣は1598年に戦死した」と 「李舜臣は四字熟語を好んだ」を区別できない。 どちらの文も訓練データに高い確率で出現しうる。 出所情報がなければ、 一方が確立された歴史的語りであり 他方が存在しない主張であることを知る術がない。
これが幻覚の物理的起源だ。
真実の断片が出所を失い混ざり合うと、 存在しない「事実」が捏造される。
解決策は明確だ。 断片を断片として扱う。 主張を主張として記録する。 出所、文脈、確信度を構造的に保存する。
構造的解決策
まともな知識システムはあらゆる語りを主張として扱わなければならない。
自然言語の文が構造化表現に変換されるとき、以下を含まなければならない:
誰が主張したか——出所エンティティ いつ主張されたか——時間的コンテキスト どの世界での主張か——世界コンテキスト どの視点から——POV(視点) 確信度はどの程度か——確信度レベル
これはオプションではない。 このようなシステムの構造がこの情報を要求する。 フィールドが空であれば、明示的に空と記される。
「李舜臣は偉大だった」が構造化表現に変換されるとき:
[エンティティ: 李舜臣]
[動詞: 偉大である (評価的動詞)]
[POV: 話者 (現在の会話参加者)]
[時間: 現在の瞬間]
[確信度: 未指定]
[出所: 話者の直接発話]
[世界: 現実世界]
まったく同じ自然言語の文「李舜臣は偉大だった」であっても、 歴史教科書が語ったものか、 個人の感想として述べたものか、 小説の登場人物が発したものかによって、 表現はまったく異なる。
曖昧さは構造的に排除される。 主張は主張として記録される。 真実の断片は断片として保存される。
地図は領土ではない
ポーランド系アメリカ人の学者アルフレッド・コジブスキーは言った:
「地図は領土ではない。」
私たちが必要としているのは地図を描く言語だ。 地図を収集し領土をリバースエンジニアリングするエンジンだ。
地図は領土の完全なレプリカではない。 地図は誰かが、何かの目的で、何かの縮尺で描いた表現だ。 同じ都市の地図は何十枚もありうる。 観光地図、地形図、路線図、人口密度図。 すべて同じ領土についての異なる主張だ。
いかなる地図も領土そのものではない。 しかし複数の地図を重ね合わせることで、領土への理解は深まる。
主張ベースの知識システムが世界を扱う方法はこれだ。 無数の主張を構造化された形式で記録し、 その上に合意とパターンを発見し、 領土へのますます精密な理解を構築する。
しかし決して「これが領土そのものだ」とは主張しない。
まとめ
真実は物理的に到達不能だ。
- 出来事は発生した瞬間に過去に消え去る。光速より速く。
- 残るのは真実の断片だけだ。光子、記録、証言。
- 脳ですら事実を格納しない。断片から再構成された主張を格納する。
- したがって、知識システムの一次データは事実ではありえない。主張でなければならない。
- 主張を事実として扱えば、矛盾はエラーになる。主張として扱えば、矛盾はデータになる。
- LLMの幻覚は主張が出所を失った結果だ。
- このようなシステムは出所、時間、視点、確信度をあらゆる語りに構造的に埋め込む。
私たちは真実を扱わない。 真実についての文を扱う。 これは謙遜ではない。これは物理学だ。