لماذا تخلق اللغة الطبيعية الهلوسات؟

الهلوسة ليست خطأً برمجياً. إنها حتمية بنيوية طالما نستخدم اللغة الطبيعية.

معجزة اللغة الطبيعية

قبل 100,000 عام، ظهرت اللغة المنطوقة. العلاقات الاجتماعية التي كان بإمكان الرئيسيات الحفاظ عليها من خلال التنظيف المتبادل كانت محدودة بنحو 150 فرداً. اللغة حطمت هذا السقف. بمجرد أن أصبح بإمكان شخص واحد التحدث إلى كثيرين في الوقت نفسه، أصبح حجم جديد من المجتمع ممكناً — القبيلة.

قبل 10,000 عام، خلقت الزراعة فوائض غذائية، وتجمع الناس في مكان واحد ليشكلوا مدناً. قبل 5,000 عام، ضغط أحدهم في بلاد ما بين النهرين علامات إسفينية الشكل على لوح طيني رطب. كان ذلك لتسجيل مخزونات الحبوب. ميلاد الكتابة. الكلام يتلاشى، لكن السجلات تبقى. حين بقيت السجلات، أصبحت البيروقراطية ممكنة، وأصبح القانون ممكناً، وأصبحت الدولة ممكنة.

اللغة المنطوقة أنشأت القبيلة. الكتابة أنشأت الدولة.

اللغة الطبيعية هي أعظم تقنية ابتكرتها البشرية على الإطلاق. ليس اكتشاف النار، ولا اختراع العجلة، ولا اختراع أشباه الموصلات. ما جعل كل ذلك ممكناً هو اللغة الطبيعية. لأن اللغة الطبيعية وُجدت، أمكن نقل المعرفة، وأمكن التعاون، وأمكن للأحياء أن يرثوا أفكار الموتى. لعشرات الآلاف من السنين، كانت اللغة الطبيعية وسيط الحضارة الإنسانية بأسرها.

والآن، أصبحت هذه اللغة الطبيعية العظيمة عنق الزجاجة في عصر الذكاء الاصطناعي.

سوء الفهم المسمى هلوسة

حين يقول الذكاء الاصطناعي شيئاً خاطئاً، نسميه “هلوسة”.

هذا الاسم يحمل دلالات ضمنية. دلالة أن الهلوسة غير طبيعية. دلالة أنه يمكن إصلاحها. دلالة أن نموذجاً أفضل سيحلها.

هذا سوء فهم.

الهلوسة ليست خطأً برمجياً في LLM. الهلوسة حتمية بنيوية لا يمكن تجنبها طالما تُستخدم اللغة الطبيعية كلغة تفكير للذكاء الاصطناعي.

مهما وسّعت النموذج، مهما وسّعت البيانات، مهما صقلت RLHF، طالما أن المدخل لغة طبيعية والمخرج لغة طبيعية، فإن الهلوسة لن تختفي.

دعوني أوضح لماذا.

العيوب البنيوية الأربعة للغة الطبيعية

تطورت اللغة الطبيعية للتواصل بين البشر. الخصائص الأربع التي اكتسبتها في هذه العملية تصبح عيوباً قاتلة في تفكير الذكاء الاصطناعي.

العيب 1: الغموض

“He went to the bank.”

هل “bank” مؤسسة مالية أم ضفة نهر؟ من هو “he”؟ متى ذهب؟

البشر يحلون هذا بالسياق. مجرى المحادثة، تعبير وجه المتحدث، المعرفة الخلفية المشتركة.

الذكاء الاصطناعي لا يملك سوى النص. النص وحده لا يستطيع حل الغموض بالكامل. إذا لم يمكن حله، يخمّن الذكاء الاصطناعي. التخمينات تكون خاطئة أحياناً. حين يُخرَج تخمين خاطئ بثقة، تلك هي الهلوسة.

العيب 2: غياب المصدر

“يي سون-شين هزم 133 سفينة بـ 12 فقط.”

هذه الجملة ليس لها مصدر.

من أدلى بهذا الادعاء؟ أي سجلات تاريخية تدعمه؟ هل هناك خلاف علمي حول هذه الأرقام؟

اللغة الطبيعية لا تملك مكاناً بنيوياً للبيانات الوصفية. لتضمين المصادر، يجب إطالة الجملة، وإطالتها تُعتّم المعنى. لذلك في معظم جمل اللغة الطبيعية، تُحذف المصادر. تُناقش هذه المشكلة بتعمق أكبر في لماذا ادعاءات، لا حقائق؟.

تُدرَّب LLM على مليارات من مثل هذه الجمل. الادعاءات ذات المصادر المحذوفة تختلط معاً في حساء إحصائي ضخم واحد.

تتبع أساس الرقم “12” داخل هذا الحساء مستحيل من حيث المبدأ. وبما أن الأساس لا يمكن تتبعه، يمكن أيضاً اختلاق أرقام بلا أساس. تلك هي الهلوسة.

العيب 3: غياب الثقة

“الأرض كروية.” “الطاقة المظلمة تشكل 68% من الكون.” “سيمطر غداً.”

مستويات الثقة لهذه الجمل الثلاث مختلفة تماماً.

الأولى إجماع ساحق. الثانية أفضل تقدير حالي، لكن النظرية قد تتغير. الثالثة توقع احتمالي.

ومع ذلك، في اللغة الطبيعية، الثلاث لها بنى نحوية متطابقة. مبتدأ + خبر. جملة خبرية. نقطة.

اللغة الطبيعية لا تستطيع التعبير بنيوياً عن “ما مدى يقين هذا”. هناك أدوات ظرفية مثل “ربما”، “شبه مؤكد”، “قد”، لكنها اختيارية وغير دقيقة وعادة ما تُحذف.

تتعلم LLM جميع الجمل بمستويات ثقة متطابقة. لا توجد طريقة للنموذج ليميز داخلياً فرق الثقة بين “الأرض كروية” و"الطاقة المظلمة 68%".

لذلك يذكر التقديرات كحقائق، ويذكر الفرضيات كآراء راسخة، ويذكر الأمور غير المؤكدة بيقين. تلك هي الهلوسة.

العيب 4: غياب السياق الزمني

“الرئيس التنفيذي لشركة Tesla هو Elon Musk.”

اعتباراً من متى؟

في 2024، هذا صحيح. في 2030، من يدري. إذا لم يُحدد وقت الكتابة، لا يمكن تحديد فترة صلاحية هذه الجملة.

معظم جمل اللغة الطبيعية تحذف السياق الزمني. “المضارع” يمكن أن يعني “الآن” أو يمكن أن يعني “بشكل عام”.

تتعلم LLM مقالات 2020 ومقالات 2024 كبيانات متماثلة. بما أن المعلومات الزمنية لا تُحفظ بنيوياً، فإنها تذكر حقائق ماضية وكأنها حاضرة، أو تخلط معلومات من فترات زمنية مختلفة. تلك هي الهلوسة.

التقاء العيوب الأربعة

تتصاعد الهلوسة بشكل انفجاري حين تتقارب هذه العيوب الأربعة.

لنحلل مخرجاً واحداً من LLM.

“يي سون-شين دمّر 330 سفينة يابانية بـ 12 سفينة، وتوفي لاحقاً في معركة نوريانغ، تاركاً الكلمات الأخيرة ‘لا تعلنوا عن وفاتي.’”

في هذه الجملة:

الغموض: ماذا يعني “دمّر” بالتحديد؟ أغرق؟ هزم؟ أضرّ جزئياً؟

غياب المصدر: ما أساس الرقمين 12 و330؟ سجلات تاريخية مختلفة تذكر أرقاماً مختلفة — أيها اتُّبع؟

غياب الثقة: هل “لا تعلنوا عن وفاتي” وصية مؤكدة تاريخياً، أم تقليد شفهي لاحق؟ مستويات الثقة للاثنين مختلفة، ومع ذلك هما مذكوران في نفس الجملة الخبرية.

غياب السياق الزمني: أي نقطة زمنية من الإجماع الأكاديمي تعكسها هذه المعلومات؟

يملأ LLM كل هذا الغموض بـ “تسلسل الرموز الأكثر معقولية”. المعقولية ليست الدقة. الفجوة بينهما هي الهلوسة.

لماذا لا تستطيع النماذج الأكبر حل هذا

“ألن تقل الهلوسة عند صدور GPT-5؟”

ستقل. لكنها لن تختفي.

النماذج الأكبر تتعلم أنماطاً أكثر تعقيداً من بيانات أكثر. لذلك تزداد دقة “المعقولية”.

لكن المشكلة الأساسية لا تتغير.

طالما أن المدخل لغة طبيعية، يبقى الغموض. طالما أن بيانات التدريب لغة طبيعية، تبقى المصادر مفقودة. طالما أن المخرج لغة طبيعية، لا تُعبَّر عن الثقة. طالما أن المعلومات الزمنية غائبة عن البنية، يبقى الزمن مشوشاً.

حتى لو وسّعت النموذج 100 مرة، فإن العيوب البنيوية للغة الطبيعية لا تنمو 100 مرة — لكنها لا تصل إلى الصفر أيضاً.

هذه ليست مشكلة دقة. إنها مشكلة وسيط.

مهما زدت دقة صورة بالأبيض والأسود، لن يظهر اللون. مهما زدت دقة اللغة الطبيعية، لن يظهر المصدر والثقة والسياق الزمني في البنية.

إذا أردت اللون، تحتاج فيلماً ملوناً. إذا أردت القضاء على الهلوسة، تحتاج لغة مختلفة.

شروط الحل البنيوي

لحل هذه العيوب الأربعة، يجب أن تكون بنية اللغة نفسها مختلفة.

الغموض –> هيكلة صريحة. حين تُحوَّل “He went to the bank” إلى لغة مهيكلة، يُحلّ “he” إلى SIDX كيان محدد، ويُحلّ “bank” إلى SIDX مؤسسة مالية أو ضفة نهر. إذا لم يمكن الحل، يُصرَّح صراحة بأنه “غير محلول”. إما حل الغموض، أو تسجيل حقيقة أنه غامض.

غياب المصدر –> مصدر مدمج. كل سرد يتضمن بنيوياً كيان مصدر. “من أدلى بهذا الادعاء” جزء من السرد. ليس اختيارياً. إذا كان الحقل فارغاً، يُعلَّم على أنه فارغ.

غياب الثقة –> ثقة مدمجة. كل حافة فعل لديها حقل ثقة. “مؤكد”، “تقديري”، “افتراضي” تُحدد بنيوياً كمُعدِّلات فعل.

غياب السياق الزمني –> سياق زمني مدمج. كل سرد يتضمن سياقاً زمنياً. “اعتباراً من متى هذا السرد” يُحدد دائماً.

ما يُحذف في اللغة الطبيعية يوجد كجزء من البنية في اللغة المهيكلة.

حين يكون الحذف مستحيلاً، يتقلص مجال الهلوسة. يشرح لماذا التوضيح ضروري هذا المبدأ. حين لا يمكنك التحدث بلا أساس، لا تُنتَج تصريحات بلا أساس.

نهاية الهلوسة تكمن في استبدال اللغة

لنلقِ نظرة على المقاربات الحالية لتقليل الهلوسة.

RAG (التوليد المعزز بالاسترجاع): يسترجع وثائق خارجية ويقدمها كسياق. فعّال، لكن الوثائق المسترجعة هي أيضاً بلغة طبيعية، لذا تتبع مشاكل الغموض وغياب المصادر وغياب الثقة دون تغيير. يستعرض لماذا RAG غير كافٍ هذا القيد بالتفصيل.

RLHF: يدرّب النموذج على قول “لا أعرف” حين يكون غير متأكد. يقلل تكرار الهلوسة، لكنه لا يحل المشكلة الأساسية وهي أن اللغة الطبيعية تفتقر لبنية الثقة.

Chain-of-Thought: يسجل عملية التفكير بلغة طبيعية. الاتجاه صحيح، لكن وسيط التسجيل هو اللغة الطبيعية، لذا يرث نفس العيوب.

جميع هذه المقاربات تحاول تخفيف الهلوسة ضمن إطار اللغة الطبيعية. إنها تعمل. لكنها ليست جذرية.

الحل الجذري هو إزالة اللغة الطبيعية من داخل الذكاء الاصطناعي.

الواجهة مع المستخدمين تبقى باللغة الطبيعية. يستمر البشر في التحدث باللغة الطبيعية وتلقي الإجابات باللغة الطبيعية.

لكن اللغة التي يفكر بها الذكاء الاصطناعي ويسجل ويتحقق داخلياً يجب أن تكون شيئاً آخر غير اللغة الطبيعية.

لغة يكون فيها المصدر جزءاً من البنية. لغة تكون فيها الثقة جزءاً من البنية. لغة يكون فيها السياق الزمني جزءاً من البنية. لغة يُعالَج فيها الغموض صراحة.

اللغة المنطوقة أنشأت القبيلة. الكتابة أنشأت الدولة. ماذا ستنشئ اللغة الثالثة؟

نهاية الهلوسة لا تكمن في نماذج أكبر بل في لغة أفضل.

ملخص

الهلوسة تولد من العيوب البنيوية الأربعة للغة الطبيعية.

الغموض: لا يمكن حله بدون سياق. الذكاء الاصطناعي يخمّن، والتخمينات خاطئة.
غياب المصدر: أساس الادعاءات مفقود. تُختلق تركيبات بلا أساس.
غياب الثقة: الحقائق والتقديرات تُعبَّر بنحو متطابق. الذكاء الاصطناعي لا يستطيع التمييز بينها.
غياب السياق الزمني: معلومات من فترات زمنية مختلفة تتشوش.

النماذج الأكبر تقلل الهلوسة لكنها لا تستطيع القضاء عليها. دون تغيير الوسيط، تبقى العيوب البنيوية.

مهما زدت دقة فيلم بالأبيض والأسود، لن يظهر اللون. إذا أردت اللون، يجب أن تغيّر الفيلم.