מדוע יש צורך בשפה מלאכותית?
השפה הטבעית התפתחה לתקשורת אנושית. עמימות, יתירות ורמיזה הם יתרונות לבני אדם אך גורמים להזיות של בינה מלאכותית. לא שפות תכנות ולא מסגרות סמנטיות קיימות הן התשובה. יש צורך בשפה מלאכותית חדשה העומדת בשישה תנאים בו-זמנית.
GEUL — שפה מלאכותית מיושרת סמנטית לתקשורת חד-משמעית בין בני אדם ובינה מלאכותית
השפה הטבעית התפתחה לתקשורת אנושית. עמימות, יתירות ורמיזה הם יתרונות לבני אדם אך גורמים להזיות של בינה מלאכותית. לא שפות תכנות ולא מסגרות סמנטיות קיימות הן התשובה. יש צורך בשפה מלאכותית חדשה העומדת בשישה תנאים בו-זמנית.
הזיה אינה באג של LLM — היא הכרח מבני הנובע מארבעה פגמים בשפה טבעית: עמימות, היעדר מקור, היעדר ודאות והיעדר זמן. מודלים גדולים יותר לא יפתרו זאת.
שפות תכנות מתארות פרוצדורות. הן אינן מסוגלות לתאר את העולם. JSON מספק מבנה אך ללא משמעות. אפילו LISP רק שואלת את התחביר.
סידור מחדש של וקטורי הטמעה שובר את המודל. הימנעות מהשבירה פירושה בניית המודל מאפס. מה שנדרש הוא לא שקיפות בתוך הקופסה השחורה, אלא שכבה שקופה מחוצה לה.
GEUL לא דוחה את ויקינתונים. היא ממירה את מערכת הסיווג ואת סטטיסטיקות התדירות של 100 מיליון ישויות לספרי קוד SIDX. דקדוק נבנה מעל מילון.
בניית מערכת פעלים מאפס פירושה פערים, בחירות שרירותיות והיעדר הצדקה. WordNet היא מסד נתונים לקסיקלי בן 40 שנה עם 13,767 סינסטים של פעלים שנבנו על ידי בלשנים. אנחנו שואלים את המילון ובונים את הדקדוק מעליו.