لماذا انتهى عصر هندسة الأوامر

من “كيف تقولها” إلى “ماذا تُظهر” – اللعبة تغيرت.


هندسة الأوامر كمهنة

في عام 2023، ظهرت مهنة جديدة.

مهندس الأوامر (Prompt Engineer).

“فكّر خطوة بخطوة.” “أنت خبير بخبرة 20 عاماً.” “دعني أُريك بعض الأمثلة أولاً.”

جمل كهذه أصبحت معرفة تقنية تساوي عشرات الآلاف من الدولارات. نفس السؤال كان ينتج إجابات مختلفة جذرياً من الذكاء الاصطناعي حسب صياغته.

هندسة الأوامر كانت تعمل فعلاً. سطر واحد من Chain-of-Thought رفع درجات الرياضيات بنسبة 20%. جملة واحدة تُعيّن دوراً غيّرت عمق الخبرة. ثلاثة أمثلة few-shot أعطت تحكماً كاملاً في تنسيق المخرجات.

لم يكن هذا ضجة إعلامية. كان حقيقياً. فلماذا ينتهي؟


لماذا كانت تعمل: لأن النماذج كانت غبية بما فيه الكفاية

انظر لسبب عمل هندسة الأوامر من المبادئ الأولى. الأمر بسيط.

النماذج اللغوية الكبيرة المبكرة كانت ضعيفة في فهم نية المستخدم. قل “لخّص” وكانت تعيد الكتابة. قل “قارن” وكانت تسرد.

لأن النموذج أساء قراءة النية، أصبحت مهارة نقل النية بدقة ذات قيمة. هندسة الأوامر كانت بالأساس “ترجمة” – تحويل نية الإنسان إلى شكل يفهمه LLM.

لكي تكون للترجمة قيمة، يجب أن يوجد حاجز لغوي.


ما الذي تغير: النماذج أصبحت ذكية

من GPT-3.5 إلى GPT-4. من Claude 2 إلى Claude 3.5. مع كل جيل، تحسنت قدرة النماذج على فهم النية بشكل مذهل.

قل “لخّص” وتلخّص. قل “قارن” وتقارن. حتى بدون أن يُقال لها “فكّري خطوة بخطوة”، تقسّم المشكلات المعقدة إلى خطوات بنفسها.

الحاجز اللغوي انخفض. قيمة الترجمة تقلصت.

تقنيات الأوامر التي أنتجت فروقات مذهلة في 2023 تنتج فروقات هامشية فقط في 2025. حين يكون النموذج ذكياً بما فيه الكفاية، تهم الصياغة أقل فأقل.

فما الذي يهم بدلاً من ذلك؟


نافذة السياق: قانون فيزيائي

لدى LLM قيد فيزيائي واحد.

نافذة السياق.

سواء كانت 128K رمز أو 1M رمز، فهي محدودة. فقط المعلومات التي تتسع داخل هذا الحيز المحدود تؤثر على التفكير. المعلومات خارج النافذة، مهما كانت مهمة، كأنها غير موجودة.

هذا مستقل عن حجم النموذج. حتى مع تريليون معامل، نافذة السياق محدودة. حتى مع بيانات تدريب تمتد عبر الإنترنت بأكمله، نافذة السياق محدودة.

مهما كان النموذج ذكياً، إذا دخلت معلومات خاطئة إلى السياق، ينتج إجابات خاطئة. إذا ملأت معلومات غير ذات صلة السياق، يفوّت ما يهم. إذا كانت المعلومات المطلوبة غائبة عن السياق، فهي كالمجهولة.

هندسة الأوامر كانت مشكلة “كيف تقولها”. اللعبة الجديدة مشكلة “ماذا تُظهر”.

هذه هي هندسة السياق.


تشبيه: الامتحان بكتاب مفتوح

إليك تشبيهاً للفرق بين هندسة الأوامر وهندسة السياق.

هندسة الأوامر هي صياغة أسئلة الامتحان جيداً. بدلاً من “اختر الإجابة الصحيحة أدناه”، اكتب “استنتج خطوة بخطوة الإجابة التي تلبي جميع الشروط التالية” – ويعطي الطالب إجابة أفضل.

هندسة السياق هي مسألة أي كتب تُحضرها لامتحان بكتاب مفتوح. مهما كانت أسئلة الامتحان جيدة الصياغة، إذا أحضر الطالب الكتب الخاطئة، لا يستطيع الإجابة. عدد الكتب التي يمكنك إحضارها محدود. أي كتب تحضرها تحدد درجتك.

حين كان النموذج غبياً، كان شكل السؤال (الأمر) مهماً. حين يكون النموذج ذكياً، المادة المرجعية (السياق) هي المهمة.


عصر الوكلاء يُسرّع التحول

هذا التحول يتسارع مع ظهور الوكلاء.

هندسة الأوامر يكتبها البشر في كل مرة. البشر يكتبون السؤال، البشر يشرحون السياق، البشر يحددون التنسيق.

الوكلاء مختلفون. الوكلاء يفكرون بأنفسهم، ويستدعون أدوات، ويتعاونون مع وكلاء آخرين. في كل خطوة، يجب عليهم تكوين السياق بأنفسهم.

وكيل استدعى API خارجي وتلقى بيانات. هذه البيانات يجب أن تدخل السياق للجولة التالية من التفكير. أي أجزاء تدخل وأي أجزاء تُترك؟ أي نتائج تفكير سابقة تُحفظ وأيها تُستبعد؟ هل يمكن الوثوق بمعلومات أرسلها وكيل آخر؟

لا يستطيع إنسان اتخاذ كل هذه القرارات في كل مرة. لكي يعمل الوكلاء باستقلالية، يجب أن يكون تكوين السياق مؤتمتاً.

هندسة الأوامر كانت مهارة بشرية. هندسة السياق يجب أن تكون قدرة نظامية.


هندسة الأوامر لا تختفي

لنمنع سوء الفهم.

لا أقول أن هندسة الأوامر تفقد معناها. أوامر النظام لا تزال مهمة. تحديد تنسيق المخرجات لا يزال ضرورياً. إعلان الأدوار والقيود لا يزال فعالاً.

ما يتقلص هو الحصة التي تشغلها هندسة الأوامر.

إذا كان 70% من جودة المخرجات يحددها الأمر في 2023، ففي 2025، 30% يحدده الأمر و70% يحدده السياق.

النسبة انقلبت.

وهذا الاتجاه لن ينعكس. النماذج ستستمر في أن تصبح أذكى، وكلما أصبحت أذكى، قلّت أهمية الصياغة وزادت أهمية السياق.


لكن هندسة السياق ليس لديها بنية تحتية

هنا لب المشكلة.

هندسة الأوامر كان لديها أدوات. قوالب أوامر، مكتبات أوامر، أطر عمل لاختبار الأوامر. نظام بيئي كامل لإدارة “كيف تقولها” بشكل منهجي بُني.

هندسة السياق ليس لديها هذا بعد.

انظر كيف يُعالَج السياق عملياً الآن.

أحجام قطع أنابيب RAG تُضبط يدوياً. المعلومات الخلفية تُكتب في أوامر النظام يدوياً. ما يُخزَّن في ذاكرة الوكيل يُصمَّم يدوياً. أي نتائج بحث توضع في السياق يُقرَّر يدوياً.

كل شيء يدوي.

والمادة الخام لكل هذا العمل اليدوي هي اللغة الطبيعية. مستندات بلغة طبيعية تُقطَّع بلغة طبيعية وتُلصق في سياق بلغة طبيعية.

اللغة الطبيعية ذات كثافة معلومات منخفضة. لا مصادر. لا مستويات ثقة. لا طوابع زمنية. رموز غير ضرورية تُستهلك لنقل نفس المعنى. لا توجد طريقة لأتمتة الحكم على الجودة.

هذا يشبه حقبة ما قبل هندسة الأوامر. هندسة الأوامر كانت يدوية أيضاً في البداية. اعتمدت على حدس وخبرة الأفراد. ثم ظهرت أدوات ومنهجيات وأصبحت منظمة.

هندسة السياق في تلك المرحلة السابقة الآن. المشكلة أُدركت، لكن البنية التحتية غير موجودة.


ما تحتاجه البنية التحتية

لكي تنتقل هندسة السياق من العمل اليدوي إلى نظام، يلزم كحد أدنى ما يلي.

الضغط. طريقة لإدخال معنى أكثر في نفس النافذة. أزل اللاصق النحوي للغة الطبيعية واترك فقط المعنى، ويتضاعف حجم النافذة الفعلي – دون تغيير النموذج.

الفهرسة. طريقة لإيجاد المعلومة الصحيحة بدقة. بحث مبني على البنية الدلالية، لا على تشابه التضمينات. بحث حيث البحث عن “إيرادات Apple” لا يسحب “القيمة الغذائية للتفاح”.

التحقق. طريقة لرفض المعلومات التي لا تستوفي المواصفات ميكانيكياً. تماماً كما يلتقط مترجم Go المتغيرات غير المستخدمة كأخطاء، يجب تصفية الادعاءات بلا مصادر والحقائق بلا طوابع زمنية قبل دخولها السياق. أرخص الفحوصات وأكثرها حتمية يجب أن تأتي أولاً.

التصفية. طريقة للحكم على الجودة الدلالية. إذا كان التحقق ينظر إلى الشكل، فالتصفية تنظر إلى المحتوى. الصلة، الموثوقية، الحداثة. هل هذه المعلومة مطلوبة فعلاً لهذه الجولة من التفكير؟

الاتساق. طريقة لضمان التماسك الداخلي لمجموعة المعلومات المختارة. معلومات جيدة فردياً يمكن أن تتناقض عند دمجها. إذا دخل المدير التنفيذي لعام 2020 والمدير التنفيذي لعام 2024 إلى السياق في آنٍ واحد، يتشوش LLM.

التركيب. طريقة لتحسين الموضع والبنية داخل النافذة. نفس المعلومة تحصل على أوزان انتباه مختلفة حسب موضعها. في البداية أم في النهاية؟ كيف تُجمَّع؟

التراكم. طريقة للنظام ليتعلم وينمو مع الوقت. التخزين المؤقت هو إعادة استخدام نتائج فردية. التراكم هو تعلم أي تركيبات سياق أنتجت نتائج جيدة، وتنمية قاعدة المعرفة ذاتها.

هذه السبعة تشكل المكدس الكامل للبنية التحتية لهندسة السياق.


هذا ليس عن أداة بعينها

لأكن صريحاً.

من يبني هذه البنية التحتية سؤال مفتوح. أداة واحدة قد تحل كل شيء، أو عدة أدوات قد تعالج كل منها طبقة.

لكن حقيقة أن البنية التحتية مطلوبة ليست سؤالاً مفتوحاً.

أن نافذة السياق محدودة حقيقة فيزيائية. حتى لو نمت النافذة 10 أضعاف، معلومات العالم تنمو أسرع. أن اللغة الطبيعية ذات كثافة معلومات منخفضة حقيقة بنيوية. أن الوكلاء يحتاجون إدارة سياق مؤتمتة للعمل باستقلالية ضرورة منطقية.

كما احتاجت هندسة الأوامر أدوات، تحتاج هندسة السياق أدوات. لكن هذه المرة، طبيعة الأدوات مختلفة.

أدوات هندسة الأوامر كانت أقرب لمحررات النصوص. أدوات هندسة السياق أقرب للمترجمات البرمجية.

ضغط المعلومات، فهرستها، التحقق منها، تصفيتها، فحص الاتساق، تحسين الموضع، وتراكم النتائج. هذا ليس تحريراً. هذه هندسة.

لهذا تُسمى هندسة “السياق”.


ملخص

كانت لهندسة الأوامر قيمة حين كانت النماذج غبية. لأن النماذج لم تقرأ النية، كانت مهارة نقل النية جيداً مهمة.

مع ازدياد ذكاء النماذج، تغيرت اللعبة. من “كيف تقولها” إلى “ماذا تُظهر”. من الأمر إلى السياق.

ظهور الوكلاء يُسرّع هذا التحول. لا يستطيع البشر تجميع السياق في كل مرة. النظام يجب أن يفعل ذلك بنفسه.

لكن حالياً، هندسة السياق ليس لديها بنية تحتية. اللغة الطبيعية تُقطَّع وتُلصق يدوياً.

البنية التحتية المطلوبة لها سبع طبقات: الضغط، الفهرسة، التحقق، التصفية، الاتساق، التركيب، التراكم.

ليس عصر هندسة الأوامر هو الذي ينتهي. بل العصر الذي كانت فيه هندسة الأوامر وحدها كافية.