الأفعال كانت ضرورية.

لجعل الذكاء الاصطناعي يصف العالم، لا بدّ من أفعال. في جملة “بنى الأدميرال الكوري يي سونسين سفينة السلحفاة”، بدون “بنى” لا توجد جملة.

لتحديد الكيانات توجد Wikidata. يي سونسين هو Q28090. سفينة السلحفاة هي Q249845. التعريف منجز.

لكن للأفعال لا يوجد ما يقابل ذلك. لا يوجد معرّف لـ"يبني". ولا معيار متفق عليه يحدد ما إذا كانت “يبني” و"يصنع" و"ينتج" بنفس المعنى أو بمعانٍ مختلفة.

كل مشروع يتعامل مع الأفعال — سواء كان رسماً بيانياً معرفياً أو بحثاً دلالياً أو تصميم لغة مُهيكلة — يواجه حتماً هذا السؤال: من أين نأتي بنظام الأفعال؟


البناء من الصفر

يمكن تصميم قائمة أفعال من البداية.

move، give، think، feel، say. نحدد نحو 50 فعلاً أساسياً ثم نضيف الأفعال الفرعية. تحت move نضع walk وrun وcrawl. تحت give نضع donate وbestow وgrant.

تظهر ثلاث مشكلات.

أولاً، الفجوات. عندما يسرد إنسان الأفعال من ذهنه، حتماً يفوته شيء. يفوته “يمتز” و"يجتر" و"يستسلم". وفي اللحظة التي يُحتاج فيها إلى الفعل المفقود، ينهار النظام.

ثانياً، غياب المعايير. هل walk وstroll فعلان مستقلان أم تنويعان لفعل واحد؟ عند البناء الذاتي يعتمد هذا الحكم على حدس المصمم. والحدس يختلف من شخص لآخر.

ثالثاً، التسلسل الهرمي تعسفي. وضعنا walk تحت move، لكن walk قد يكون أيضاً فرعاً من travel. المصمم يقرر أين يضعه، بلا مبرر موضوعي.

نظام الأفعال المبني ذاتياً يبدو مثالياً في ذهن مصممه. لكن حين يراه شخص آخر يتساءل: “لماذا صُنّف هكذا؟”


إرث WordNet

قاعدة بيانات معجمية إنجليزية بدأ إنشاؤها في جامعة برينستون عام 1985.

على مدار 40 عاماً، جمع لغويون الكلمات الإنجليزية في وحدات معنوية (synset) وربطوها بعلاقات هرمية. الأفعال وحدها تضم 13,767 synset. لكل synset معرّف فريد وتعريف وعلاقات صريحة مع synset أخرى.

“donate” و"bestow" مجمعتان في نفس الـsynset. أي أنهما بنفس المعنى. “donate” هي troponym لـ"give". أي أنها شكل محدد من give. “give” هي troponym لـ"transfer". أي أنها شكل محدد من transfer.

هذا التسلسل الهرمي مُعدّ مسبقاً لـ13,767 فعلاً.

لا فجوات. لأن لغويين ملأوها على مدار 40 عاماً. توجد معايير. لأن تعريفات وعلاقات الـsynset صريحة. التسلسل الهرمي مبرَّر. لأن علاقات troponym مبنية على تحليل لغوي.


القاموس شيء والقواعد شيء آخر

إذا كانت WordNet قاموس الأفعال، فكيفية استخدام تلك الأفعال مسألة منفصلة.

WordNet تخبرنا ما معنى “give” وما علاقتها بـ"donate". لكنها لا تخبرنا بنية استخدام “give” في جملة — من يُعطي، وماذا يُعطى، ولمن.

هذا مماثل لعلاقة Wikidata. Wikidata تخبرنا أن يي سونسين هو Q28090. لكن كيفية بناء جملة عن يي سونسين ليست من شأن Wikidata.

نستعير القاموس، لكن القواعد نبنيها بأنفسنا.

ما نأخذه من WordNet هو: معرّفات synset، التعريفات الدلالية، وشجرة تسلسل troponym. أما verb frame وبنية المشاركين وأنماط التركيب التي تقدمها WordNet أيضاً، فالأفضل أن يصممها كل مشروع بنفسه. لأن المعلومات النحوية في WordNet مرتبطة بالإنجليزية، والنظام الدلالي للفعل وطريقة استخدامه مسألتان مستقلتان.


من 13,767 إلى 10

سرد جميع أفعال WordNet البالغة 13,767 لا فائدة منه. نحتاج بنية.

بتتبع شجرة troponym في WordNet صعوداً، نصل إلى عُقد قمة لا يمكن الصعود فوقها. الأفعال الجذرية. عددها 559.

بتجميع الـ559 دلالياً نحصل على 68 بدائية فرعية (sub-primitive). بتجميع الـ68 أكثر نحصل على 10 بدائيات (primitive).

13,767 فعل → 559 جذر → 68 بدائية فرعية → 10 بدائيات

BE        — الوجود، الامتلاك، الموقع
PERCEIVE  — الإدراك، الاستشعار، الاكتشاف
FEEL      — العاطفة، التفضيل، الرغبة
THINK     — التفكير، الحكم، التذكر
CHANGE    — التغيّر، البدء، الانتهاء
CAUSE     — الفعل، الإنشاء، التدمير
MOVE      — الحركة، الوصول، المغادرة
COMMUNICATE — النطق، الإشارة، الاتفاق
TRANSFER  — التسليم، الاستلام، التبادل
SOCIAL    — التعاون، التنافس، الانتماء

هذه العشرة هي البدائيات الدلالية للأفعال البشرية. ليست من حدس فرد واحد، بل من بنية 40 عاماً من تراكم WordNet و13,767 نقطة بيانات.

هذا التسلسل من أربع طبقات — بدائيات، بدائيات فرعية، جذور، أفعال فردية — يتيح ضبط الدقة. بنظرة عامة هناك 10 أنواع من الأفعال، وبنظرة دقيقة هناك 13,767 نوعاً. نقرأ عند مستوى الدقة المطلوب.


التوسيع والضغط

إذا لم تكفِ 13,767؟ يمكن إضافة أفعال جديدة. أفعال متعددة اللغات، مصطلحات مستحدثة، مصطلحات تخصصية. نضيفها تحت البدائية الفرعية المناسبة. النظام القائم لا ينكسر.

إذا كانت 13,767 كثيرة؟ يمكن دمج synset المترادفة في واحدة. نعيد توجيه donate إلى give. البيانات المسجلة سابقاً بـdonate تجد طريقها إلى give. نفس مبدأ HTTP 301.

المهم هو الترتيب. ندخل الكل أولاً، نشغّل فعلياً، ننظر في بيانات الاستخدام، ثم نقلّص. التقليص على الورق بدون بيانات يُضيع تمييزات ضرورية.


ما وراء ذلك: الذرات الدلالية

أفعال WordNet الـ13,767 هي قائمة الأفعال التي سمّاها البشر. شاملة، لكنها ليست كل شيء.

يمكن تفكيك “give” أكثر: CAUSE + HAVE + MOVE. التحليل إلى ذرات دلالية (semantic primitive). عند اكتمال هذا التحليل، يمكن التعبير عن أفعال غير موجودة في القائمة بتركيب الذرات.

إذا كانت WordNet مكتبة قياسية، فنظام الذرات الدلالية هو المترجم. كما يستطيع المترجم بناء دوال غير موجودة في المكتبة القياسية.

هذا تحدٍ بحثي كبير، ويُحاول بعد أن يعمل النظام المبني على WordNet. في الوقت الحالي، المكتبة القياسية كافية.


خلاصة

كل مشروع يسعى لبناء نظام أفعال يواجه نفس السؤال: من أين نأتي به؟

البناء الذاتي يعني فجوات وتعسفاً وغياب الأساس. البناء فوق WordNet يعني لا فجوات، وإجماعاً، ومرجعية بيانية.

WordNet هي قاموس الأفعال البشرية الذي راكمه لغويون على مدار 40 عاماً. نستعير كلمات هذا القاموس، ونبني القواعد بأنفسنا. هذا هو سبب استخدام Wikidata للكيانات، وWordNet للأفعال.