מה היסטוריית השפות המלאכותיות לימדה אותנו, ולמה שפה מלאכותית לעידן ה-AI הולכת בנתיב שונה
החלום של 1887
ב-1887, רופא עיניים פולני בשם לודוויק זמנהוף פרסם שפה משותפת לאנושות.
אספרנטו.
האבחנה של זמנהוף הייתה ברורה. מכיוון שכל אומה מדברת בשפה אחרת, נוצרים אי-הבנות. אי-הבנות מולידות עימות, ועימות מוליד מלחמה. אם כל בני האדם חלקו שפה אחת, העולם היה מתקרב לשלום.
אספרנטו עוצבה בצורה יפה. הדקדוק שלה שלם ב-16 כללים. ללא חריגים. שורשיה שאובים משפות אירופיות מרכזיות, מה שמקל על הלמידה. ההגייה תואמת את הכתיב.
זמנהוף זיהה את חוסר היעילות של שפה טבעית וניסה לפתור אותו בשפה מלאכותית שתוכננה במכוון.
137 שנים מאוחר יותר, לאספרנטו יש כ-2 מיליון דוברים. 0.025% מאוכלוסיית העולם. אספרנטו נכשלה.
למה?
שלוש סיבות כישלון
סיבה 1: צריך ללמוד אותה
לא משנה כמה אספרנטו קלה, ללמוד שפה חדשה הוא עלות.
צריך לשלוט ב-16 כללים. צריך לשנן שורשים. צריך תרגול בחשיבה וכתיבה בשפה הזו.
נניח שלוקח לדובר עברית 100 שעות ללמוד אספרנטו. 100 שעות זה לא מעט. כדי שתהיה מוטיבציה להשקיע 100 שעות, צריך שכבר יהיה מישהו לתקשר איתו באספרנטו.
אבל מעטים מדברים אספרנטו. כי מעטים מדברים, אין מוטיבציה ללמוד. כי אף אחד לא לומד, אפילו פחות אנשים מדברים.
מקרה לימודי של אפקט רשת הפוך. בעיית הביצה והתרנגולת. אספרנטו תקועה במלכודת הזו כבר 137 שנים.
סיבה 2: היא נדרשה להחליף שפות קיימות
מטרת אספרנטו הייתה להשלים או להחליף שפות טבעיות קיימות.
זה אומר לשנות את ההרגלים של כל האנושות. כשאנגלית כבר משמשת כלשון בינלאומית, הכנסת שפה חדשה דורשת מכל המשתתפים להחליף בו-זמנית.
גם אם אדם אחד ילמד אספרנטו, אין טעם אם הצד השני עונה באנגלית. ההחלפה חייבת להיות בו-זמנית, והחלפה בו-זמנית כמעט בלתי אפשרית.
סיבה 3: תקשורת עצמה הייתה המטרה
סיבת הקיום של אספרנטו הייתה תקשורת. אנשים משוחחים ביניהם באספרנטו. כותבים מכתבים, קוראים ספרים, מנהלים דיונים.
אבל בני אדם כבר מתקשרים. בשפות האם שלהם, באנגלית, במחוות. לא מושלם, אבל עובד.
“תקשורת טובה יותר” מושכת, אבל המוטיבציה לנטוש “תקשורת שכבר עובדת” אינה מספקת.
שפה מלאכותית לעידן ה-AI יכולה להימנע מכל השלוש
אם הייתה קיימת שפה מלאכותית ל-AI, היא הייתה שונה מאספרנטו כמעט בכל מובן.
הבדל 1: אין צורך ללמוד אותה
אספרנטו היא שפה שבני אדם משתמשים בה ישירות. המשתמש העיקרי של שפה מסוג זה הוא AI.
שפה מסוג זה היא ייצוג ביניים (IR) שפועל בתוך AI. משתמשים מדברים בשפה טבעית ומקבלים תשובות בשפה טבעית. היא פועלת בצורה בלתי נראית ביניהם.
כשם שמתכנת שלא יודע דבר על LLVM IR יכול לכתוב C++, משתמש שלא יודע דבר על שפה זו יכול להשתמש ב-AI.
עלות הלמידה היא אפס. בעיית אפקט הרשת אינה מתעוררת. אף משתמש לא צריך להחליף.
הבדל 2: היא לא מחליפה שפות קיימות
אספרנטו חמדה את מקומה של השפה הטבעית. לשפה מסוג זה אין עניין במקום הזה.
בני אדם ממשיכים לדבר שפה טבעית. בעברית, באנגלית, בספרדית. מה שהיא מחליפה הוא לא שפה טבעית, אלא את התפקיד ששפה טבעית ממלאה זמנית בתוך AI.
המדיום של הסקה. פורמט האחסון של ידע. הפרוטוקול לתקשורת בין מערכות.
היא מסירה שפה טבעית מתפקיד זה ומכניסה שפה מובנית. שום דבר בהרגלי בני האדם לא משתנה.
הבדל 3: תקשורת אינה המטרה
מטרת אספרנטו הייתה תקשורת. מטרת שפה מסוג זה היא תיעוד ואימות.
מבנון ההסקה של AI ותיעודה. הפיכת התיעוד הזה לניתן לשימוש חוזר. אפשור בני אדם לאמת את התיעוד הזה.
תקשורת היא העבודה של שפה טבעית. היא כבר עושה אותה היטב. שפה מסוג זה מטפלת במה ששפה טבעית אינה יכולה.
אבל בני אדם יכולים לראות את השפה הזו
יש הבחנה חשובה אחת כאן.
רק כי שפה זו היא “שפת ביניים בלתי נראית” לא אומר שבני אדם לעולם לא יכולים לראות אותה.
שפה מסוג זה צריכה להיות פתוחה לבני אדם דרך עורך חזותי.
כשרוצים לדעת את הבסיס לשיפוט ש-AI עשה, אפשר לפתוח את גרף ההסקה ישירות.
לא קוראים מילים בינאריות בנות 16 ביט. הגרף מוויזואלי. לוחצים על צומת ומידע הישות מופיע. עוקבים אחרי קשת ונתיב ההסקה הופך לנראה. מקורות, חותמות זמן ורמות ודאות מוצגים חזותית.
זו לא למידת שפה. זו קריאת מפה.
כשם שלא צריך ללמוד מדידה כדי לקרוא Google Maps, לא צריך ללמוד דקדוק בינארי כדי להשתמש בעורך החזותי.
ממשק האימות
העורך החזותי הוא החלק האחרון שמשלים את עקרון הקופסה הלבנה.
גם אם הסקה מתועדת בשקיפות, שקיפות היא חסרת משמעות אם בני אדם אינם יכולים לגשת לתיעוד הזה.
עם עורך חזותי:
כש-AI עונה “Yi Sun-sin הביס 133 ספינות עם 12 ספינות,” המשתמש יכול לפתוח את גרף ההסקה שמאחורי התשובה הזו.
אילו ישויות אוזכרו? Yi Sun-sin, קרב מיונגנאנג, חיל הים של ג’וסון. ממה מקורות הגיע מידע זה? יומני שושלת ג’וסון, נאנג’ונג אילגי, מאמרים אקדמיים. מהי רמת הוודאות של המספר 12? מאיפה הגיע 133? האם רשומות יפניות וקוריאניות חלוקות?
המשתמש מסתכל על זה ושופט: “האם אני יכול לסמוך על התשובה הזו?”
זוהי אמון ביקורתי, לא אמונה עיוורת.
מה שאספרנטו חלמה עליו היה “עולם שבו כל בני האדם מתקשרים באותה שפה.” מה ששפה מסוג זה יוצרת הוא “עולם שבו בני אדם יכולים לאמת ישירות את שיפוטי ה-AI.”
מה אספרנטו לימדה אותנו
כישלון אספרנטו לא נבע מכך שהיא הייתה שפה גרועה. אספרנטו היא שפה מצוינת. העיצוב שלה אלגנטי ולוגי.
מה שנכשל הייתה האסטרטגיה.
לבקש מבני אדם ללמוד שפה חדשה. לנסות להחליף את מקומן של שפות קיימות. להניח שכל המשתתפים יחליפו בו-זמנית.
שפה מלאכותית לעידן ה-AI חייבת לשקף בדיוק את הלקחים הללו.
| אספרנטו | שפה פנימית ל-AI | |
|---|---|---|
| משתמש עיקרי | בני אדם | AI |
| למידה נדרשת | כן | לא |
| מחליפה שפות קיימות | ניסתה | לא |
| גישה אנושית | ללמוד ולקרוא | לצפות דרך עורך חזותי |
| מטרה | תקשורת | תיעוד ואימות |
| עלות החלפה | כל המשתתפים | מערכות AI בלבד |
אספרנטו ניסתה להרוס את מחסום השפה בין בני אדם. שפה מלאכותית לעידן ה-AI הורסת את מחסום השקיפות בין בני אדם ל-AI.
המטרה שונה, האסטרטגיה שונה, ולכן היא נמנעת מהמלכודת שאספרנטו נפלה אליה.
סיכום
אספרנטו נכשלה משלוש סיבות.
- היה צריך ללמוד אותה. היא נפלה למלכודת אפקט הרשת.
- היא ניסתה להחליף שפות קיימות. החלפה בו-זמנית הייתה בלתי אפשרית.
- תקשורת הייתה המטרה. לא הייתה מוטיבציה להחליף תקשורת שכבר עבדה.
שפה מלאכותית לעידן ה-AI יכולה להימנע מכל שלוש המלכודות.
- המשתמש העיקרי הוא AI, אז בני אדם לא צריכים ללמוד אותה.
- היא לא מחליפה שפה טבעית. היא מטפלת רק בתפקידים בתוך AI.
- המטרה אינה תקשורת אלא תיעוד ואימות.
ובני אדם יכולים לראות את ההסקה של AI ישירות דרך עורך חזותי. בלי ללמוד את השפה. כאילו קוראים מפה.
מה שאספרנטו לימדה אותנו: הצלחה או כישלון של שפה מלאכותית תלויים לא באלגנטיות העיצוב, אלא באסטרטגיה.