למה טענות, לא עובדות?

האמת נעלמת מהר יותר ממהירות האור

הרגע הזה הוא כבר העבר

עכשיו, בזמן שאתה קורא את המשפט הזה, הרגע שבו המשפט הזה נכתב הוא כבר בעבר.

האור שהגיע לעיניך נסע מהמסך, ולקח כמה ננושניות להגיע לרשתית. האות מהרשתית לוקח עשרות מילישניות לנסוע דרך עצב הראייה למוח. המוח לוקח מאות מילישניות לפרש את האות כ"משפט."

עד הרגע שאתה מרגיש ש"קראת" את המשפט הזה, הרגע שבו המשפט הזה היה על המסך הוא כבר מאות מיליוני ננושניות בעבר.

זו לא מטאפורה. זו פיזיקה.

האמת אינה נגישה

בעולם הפיזי, “אירוע” הוא נקודה במרחב-זמן.

ברגע שאירוע מתרחש, הוא פולט מידע. פוטונים, גלי קול, גלי כבידה, עקבות כימיים. מידע זה מתפשט במהירות האור או מתחתיה.

אבל האירוע עצמו? המצב המלא ברגע ובמיקום המדויקים שבהם הוא התרחש?

הוא נעלם אל העבר מהר יותר ממהירות האור.

0.001 שניות אחרי האירוע, הוא כבר בעבר. שום צופה לא יכול לגשת לאירוע “עצמו.” מה שמגיע אלינו תמיד הם העקבות שהאירוע השאיר מאחוריו.

פוטונים שהשתקפו. טקסט שנרשם. שמועות שהועברו. נתונים שנמדדו.

הכל שברים. שברים של אמת. לא האמת עצמה.

המוח לא מאחסן עובדות

מדעי המוח חשפו אמת לא נוחה.

זיכרון אנושי אינו הקלטה. הוא שחזור.

כשאתה זוכר “ראיתי מכונית אדומה אתמול,” אין תמונה של “מכונית אדומה” מאוחסנת במוח שלך.

מה שבאמת קורה הוא כך:

פוטונים מגיעים לרשתית.
תאי קונוס ברשתית ממירים אורכי גל ספציפיים לאותות.
הקורטקס החזותי מרכיב את האותות לדפוסים.
ההיפוקמפוס מקודד דפוסים אלה יחד עם הקשר.
במהלך השינה, קודים אלה מאורגנים מחדש ונדחסים.

הזיכרון “ראיתי מכונית אדומה” הוא מוצר שהורכב מחדש ברגע השליפה משברים מפוזרים על פני מספר אזורי מוח.

לכן זיכרונות משתנים. בכל פעם שאתה נזכר באותו אירוע, הוא נבנה מחדש מעט אחרת. חוויות חדשות מזהמות זיכרונות ישנים. אפשר אפילו לזכור דברים שלא קרו מעולם.

מה שהמוח מאחסן אינו “עובדות.” מה שהמוח מאחסן הוא “כך זה הרגיש, כך זה נראה, כך פירשתי את זה” — טענות.

כל הידע הוא טענות

הרחב עיקרון זה מזיכרון אישי לידע ציוויליזציוני, ואותו מבנה חוזר.

היסטוריה: “Yi Sun-sin מת בקרב נוריאנג ב-1598.”

האם זו עובדה?

מה שיש לנו: קיימים רשומות בתולדות שושלת ג’וסון. קיימים רשומות בכתבי האדמירל Yi. קיימים רשומות יפניות. קיימים מאות שנים של פרשנות אקדמית.

כולם טענות. טענות שסופרו על ידי מקורות שונים, בזמנים שונים, מנקודות מבט שונות.

“Yi Sun-sin מת ב-1598” אינה עובדה — היא הסכמה של טענות אלה. הסכמה ברמת ודאות גבוהה מאוד, אבל עדיין הסכמה.

מדע: “מהירות האור היא 299,792,458 מ/ש.”

האם זו עובדה?

מה שיש לנו: ניסויים אינספור מדדו ערך זה. התיאוריה הפיזיקלית הנוכחית מנבאת ערך זה. הלשכה הבינלאומית למשקלות ולמידות אימצה ערך זה כהגדרה.

כולם טענות. טענות שעברו דרך מגבלות מכשירי מדידה, הנחות תיאוריות ונהלי הסכמה. ההסתברות שמדידה מדויקת יותר מחר תתקן ערך זה נמוכה ביותר, אבל באופן עקרוני, היא לא אפס.

חדשות: “שוק המניות ירד 3% היום.”

האם זו עובדה?

זהו מספר שנרשם על ידי מערכת הבורסה. בהנחה שהמערכת פעלה כראוי. תלוי איזו נקודת ייחוס מגדירה “3%.”

זה נראה כעובדה, אבל בהגדרה מדויקת, זו טענה שנרשמה על ידי מערכת ספציפית בתנאים ספציפיים.

ההיררכיה של האמת

מערכת ידע ראויה חייבת לשקף מציאות אפיסטמולוגית זו בעיצובה.

אם האמת אינה נגישה, אז כל מה שנוכל לטפל בו הן טענות על האמת.

על גבי אוסף של טענות, ניתן לחשב הסכמה וודאות.

ניתן למבנה את זה בארבע שכבות.

L3 — סיפור/תצפית: “הכתב הזה, בזמן הזה, מנקודת המבט הזו, דיווח את זה.” הנתון הפרימיטיבי ביותר. סובייקטיבי ואישי. הנתון הראשוני שמערכת ידע מטפלת בו ישירות.

L2 — הסכמה/דעה מבוססת: “מסינתזה של מספר סיפורים, זה התיאור הסביר ביותר.” התוצאה של צבירת מספר טענות L3. הסתברותית וזמנית.

L1 — כללים/חוקים: “בעולם הזה, הכלל הזה פועל.” חוקי פיזיקה, חוקי משחק, נורמות חברתיות. אם נשברים, המערכת נכנסת למצב של סתירה.

L0 — מתמטיקה/לוגיקה: 1+1=2. כללי הפעולות הלוגיות. רק זה לבדו אינו טענה. זהו כלל הפעלה של המנוע. לא נתונים.

המפתח הוא:

נקודת ההתחלה היא תמיד L3 — טענות. השכבות הנותרות הן נגזרות שמחושבות על גבי טענות.

למה מערכות קיימות מאחסנות עובדות?

הסתכל על Wikidata.

Q8492 (Yi Sun-sin)
  - instance of: human
  - occupation: naval commander
  - date of death: 1598-12-16

אין “מי העלה את הטענה הזו.” אין “מה רמת הוודאות.” אין “האם יש טענות סותרות.”

הקביעה שתאריך המוות של Yi Sun-sin הוא 16 בדצמבר 1598 היא תוצאה של הסכמה בין מספר רשומות היסטוריות וחוקרים, ובכל זאת Wikidata מאחסנת אותה כאילו הייתה אמת אוניברסלית.

ברוב המקרים, זו לא בעיה. כי רמת הוודאות של ההסכמה גבוהה מספיק.

אבל שקול את המצבים הבאים:

שני כלי תקשורת מפרסמים דיווחים סותרים על אותו אירוע. היסטוריון מציג פרשנות חדשה שסותרת את הדעה המבוססת. מאמר מדעי נכשל בשחזור תוצאות ניסוי קיימות.

במערכת שמאחסנת “עובדות,” זו שגיאה. אחד מהם טועה. צריך לתקן.

במערכת שמאחסנת “טענות,” זה נורמלי. מקורות שונים, מנקודות מבט שונות, העלו טענות שונות. שתי הטענות נרשמות. הסכמה וודאות מחושבות על גביהן.

המציאות אינה נקייה. סתירה היא חלק מהמציאות. מערכת שמתייחסת לסתירה כשגיאה אינה יכולה להכיל מציאות.

המקור הפיזי של הזיה

נבחן מחדש את בעיית ההזיות של LLM-ים מנקודת מבט זו.

LLM-ים מאומנים על מיליארדי משפטים. כל משפט הוא טענה שנכתבה על ידי מישהו בהקשר כלשהו.

אבל LLM-ים לומדים אותם לא כ"טענות" אלא כ"עובדות על העולם."

מקורות נעלמים. הקשר נעלם. ודאות נעלמת. נקודות מבט נעלמות.

מה שנותר הם רק דפוסים סטטיסטיים.

אז LLM לא יכול להבחין בין “Yi Sun-sin מת ב-1598” לבין “Yi Sun-sin חיבב פתגמים בני ארבע מילים.” שני המשפטים יכולים להופיע בהסתברות גבוהה בנתוני האימון, וללא מידע על מקורות, אין דרך לדעת שאחד הוא סיפור היסטורי מבוסס והשני הוא טענה שלא קיימת.

זהו המקור הפיזי של הזיה.

כששברי אמת מאבדים את מקורותיהם ומתערבבים, “עובדות” שלא קיימות מפוברקות.

הפתרון ברור. התייחס לשברים כשברים. רשום טענות כטענות. שמור מבנית מקורות, הקשר וודאות.

פתרון מבני

מערכת ידע ראויה חייבת להתייחס לכל סיפור כטענה.

כשמשפט בשפה טבעית מומר לייצוג מובנה, הוא חייב לכלול:

מי העלה את הטענה — ישות מקור מתי הועלתה הטענה — הקשר זמני באיזה עולם הטענה — הקשר עולמי מאיזו נקודת מבט — POV (Point of View) מה רמת הוודאות — רמת ביטחון

זה לא אופציונלי. מבנה המערכת דורש מידע זה. אם שדה ריק, הוא מסומן במפורש כריק.

כש"Yi Sun-sin היה גדול" מומר לייצוג מובנה:

[Entity: Yi Sun-sin]
[Verb: be great (evaluative verb)]
[POV: Speaker (current conversation participant)]
[Time: Present moment]
[Confidence: Not specified]
[Source: Speaker's direct utterance]
[World: Real world]

גם עבור המשפט הזהה בשפה טבעית “Yi Sun-sin היה גדול,” הייצוג שונה לחלוטין בהתאם לכך אם הוא מסופר על ידי ספר לימוד היסטוריה, נאמר כהתרשמות אישית, או נאמר על ידי דמות ברומן.

עמימות מסולקת מבנית. טענות נרשמות כטענות. שברי אמת נשמרים כשברים.

המפה אינה הטריטוריה

החוקר הפולני-אמריקאי אלפרד קורז’יבסקי אמר:

“המפה אינה הטריטוריה.”

מה שאנחנו צריכים הוא שפה לציור מפות. מנוע שאוסף מפות ומהנדס לאחור את הטריטוריה.

מפה אינה העתק מושלם של הטריטוריה. מפה היא ייצוג שנוצר על ידי מישהו, למטרה כלשהי, בקנה מידה כלשהו. יכולות להיות עשרות מפות של אותה עיר. מפות תיירים, מפות טופוגרפיות, מפות תחבורה, מפות צפיפות אוכלוסין. כולן טענות שונות על אותה טריטוריה.

שום מפה אינה הטריטוריה עצמה. אבל על ידי שכבות של מספר מפות, ההבנה שלנו על הטריטוריה מעמיקה.

כך מערכת ידע מבוססת טענות מטפלת בעולם. היא רושמת אינספור טענות בצורה מובנית, מגלה הסכמה ודפוסים על גביהן, ובונה הבנה הולכת ומדויקת יותר של הטריטוריה.

אבל היא לעולם לא טוענת, “זו הטריטוריה עצמה.”

סיכום

האמת אינה נגישה פיזית.

אירועים נעלמים אל העבר ברגע שהם מתרחשים. מהר יותר ממהירות האור.
כל מה שנותר הם שברי אמת. פוטונים, רשומות, עדויות.
גם המוח לא מאחסן עובדות. הוא מאחסן טענות שנבנו מחדש משברים.
לכן, הנתון הראשוני של מערכת ידע אינו יכול להיות עובדות. חייב להיות טענות.
אם מתייחסים לטענות כעובדות, סתירה הופכת לשגיאה. אם מתייחסים אליהן כטענות, סתירה הופכת לנתונים.
הזיית LLM היא התוצאה של טענות שמאבדות את מקורותיהן.
מערכת כזו מטמיעה מבנית מקור, זמן, נקודת מבט וודאות בכל סיפור.

אנחנו לא מטפלים באמת. אנחנו מטפלים במשפטים על אמת. זו לא ענווה. זו פיזיקה.