בינה מלאכותית זקוקה לשפה חדשה
GEUL — שפה מלאכותית מיושרת סמנטית לתקשורת חד-משמעית בין בני אדם ובינה מלאכותית
מדוע יש צורך בשפה מלאכותית?
השפה הטבעית התפתחה לתקשורת אנושית. עמימות, יתירות ורמיזה הם יתרונות לבני אדם אך גורמים להזיות של בינה מלאכותית. לא שפות תכנות ולא מסגרות סמנטיות קיימות הן התשובה. יש צורך בשפה מלאכותית חדשה העומדת בשישה תנאים בו-זמנית.
למה שפה טבעית יוצרת הזיות?
הזיה אינה באג של LLM — היא הכרח מבני הנובע מארבעה פגמים בשפה טבעית: עמימות, היעדר מקור, היעדר ודאות והיעדר זמן. מודלים גדולים יותר לא יפתרו זאת.
למה שפות תכנות אינן מספיקות
שפות תכנות מתארות פרוצדורות. הן אינן מסוגלות לתאר את העולם. JSON מספק מבנה אך ללא משמעות. אפילו LISP רק שואלת את התחביר.
למה וקטורי הטמעה לא מספיקים
סידור מחדש של וקטורי הטמעה שובר את המודל. הימנעות מהשבירה פירושה בניית המודל מאפס. מה שנדרש הוא לא שקיפות בתוך הקופסה השחורה, אלא שכבה שקופה מחוצה לה.
למה ויקינתונים
GEUL לא דוחה את ויקינתונים. היא ממירה את מערכת הסיווג ואת סטטיסטיקות התדירות של 100 מיליון ישויות לספרי קוד SIDX. דקדוק נבנה מעל מילון.
?WordNet למה
בניית מערכת פעלים מאפס פירושה פערים, בחירות שרירותיות והיעדר הצדקה. WordNet היא מסד נתונים לקסיקלי בן 40 שנה עם 13,767 סינסטים של פעלים שנבנו על ידי בלשנים. אנחנו שואלים את המילון ובונים את הדקדוק מעליו.
למה הערות צריכות להיות אינדקס
הערות נכתבות בשביל בני אדם. אבל כשיש 10,000 פונקציות, גם מכונות צריכות לקרוא אותן. אם הופכים הערות מסיפור לאינדקס, סריקה מלאה הופכת לחיפוש מיידי.
למה חייבים להשאיר ריק
GEUL משאיר 75% ממרחב 64 הביט שלו ריק. הלקחים של IPv4, Unicode ו-ASCII מלמדים אותנו — עלות המילוי בלתי הפיכה, אבל עלות ההשארה ריק היא אפס.