لماذا يحصل شخصان على نتيجتين مختلفتين تماماً من النموذج نفسه؟ لأن الفرق لم يعد في امتلاك أداة الذكاء الاصطناعي، بل في القدرة على تصميم المهمة والسياق ومعايير النجاح التي يعمل داخلها النموذج.
مرحباً بك في هذا الكورس التطبيقي حول هندسة المطالبات بالذكاء الاصطناعي. لن نتعامل هنا مع المطالبة بوصفها سؤالاً مزخرفاً أو قالباً سحرياً، بل بوصفها مواصفات تشغيل تحدد للنموذج ما الذي يجب إنجازه، وما المعلومات التي يعتمد عليها، وما الأدوات المسموح بها، وكيف تُقاس جودة النتيجة.
تغيّر استخدام نماذج الذكاء الاصطناعي كثيراً منذ ظهور واجهات المحادثة الأولى. فالنموذج الحديث يستطيع قراءة ملفات متعددة، والبحث في الويب، وإجراء بحث عميق، وتشغيل الشيفرة، وتحليل الصور والبيانات، والتخطيط لمهام طويلة. ولهذا أصبحت مهارة المستخدم الحقيقية هي اختيار المسار الصحيح للمهمة، لا مجرد إضافة كلمات مثل «احترافي» و«مفصل» إلى الطلب.[1]
هذا الكورس موجه لمن تجاوز مرحلة الأسئلة البسيطة ويريد بناء نتائج قابلة للتكرار والتحقق. ستتعلم كيف تصمم المطالبة، وتدير السياق، وتختار بين البحث والاستدلال، وتقاوم التملق الآلي، وتبني اختبارات للمخرجات، ثم تحول المطالبة الناجحة إلى قالب أو مهارة أو سير عمل.
قاعدة الكورس: المطالبة الجيدة ليست الأطول، بل الأقل غموضاً والأكثر ارتباطاً بالمهمة والقابلة للقياس.
مخرجات التعلم وكيف تستخدم هذا الكورس
بنهاية الكورس ستكون قادراً على تشخيص سبب ضعف أي مطالبة، وبناء سياق مناسب، واختيار النموذج والأداة، وتحديد صيغة الإخراج، ووضع معيار نجاح، وإنشاء حالات اختبار تكشف الأخطاء قبل اعتماد النتيجة.
لتحقيق ذلك، لا تقرأ الوحدات قراءة نظرية فقط. طبّق التمرين الموجود في نهاية كل وحدة على مهمة حقيقية من عملك، واحتفظ بنسخ المطالبة ونتائجها. هذه السجلات ستصبح لاحقاً مختبرك الشخصي لفهم ما ينجح مع كل نموذج.
المتطلبات السابقة:
مرحباً بك في هذا الكورس التطبيقي حول هندسة المطالبات بالذكاء الاصطناعي. لن نتعامل هنا مع المطالبة بوصفها سؤالاً مزخرفاً أو قالباً سحرياً، بل بوصفها مواصفات تشغيل تحدد للنموذج ما الذي يجب إنجازه، وما المعلومات التي يعتمد عليها، وما الأدوات المسموح بها، وكيف تُقاس جودة النتيجة.
تغيّر استخدام نماذج الذكاء الاصطناعي كثيراً منذ ظهور واجهات المحادثة الأولى. فالنموذج الحديث يستطيع قراءة ملفات متعددة، والبحث في الويب، وإجراء بحث عميق، وتشغيل الشيفرة، وتحليل الصور والبيانات، والتخطيط لمهام طويلة. ولهذا أصبحت مهارة المستخدم الحقيقية هي اختيار المسار الصحيح للمهمة، لا مجرد إضافة كلمات مثل «احترافي» و«مفصل» إلى الطلب.[1]
هذا الكورس موجه لمن تجاوز مرحلة الأسئلة البسيطة ويريد بناء نتائج قابلة للتكرار والتحقق. ستتعلم كيف تصمم المطالبة، وتدير السياق، وتختار بين البحث والاستدلال، وتقاوم التملق الآلي، وتبني اختبارات للمخرجات، ثم تحول المطالبة الناجحة إلى قالب أو مهارة أو سير عمل.
قاعدة الكورس: المطالبة الجيدة ليست الأطول، بل الأقل غموضاً والأكثر ارتباطاً بالمهمة والقابلة للقياس.
مخرجات التعلم وكيف تستخدم هذا الكورس
بنهاية الكورس ستكون قادراً على تشخيص سبب ضعف أي مطالبة، وبناء سياق مناسب، واختيار النموذج والأداة، وتحديد صيغة الإخراج، ووضع معيار نجاح، وإنشاء حالات اختبار تكشف الأخطاء قبل اعتماد النتيجة.
لتحقيق ذلك، لا تقرأ الوحدات قراءة نظرية فقط. طبّق التمرين الموجود في نهاية كل وحدة على مهمة حقيقية من عملك، واحتفظ بنسخ المطالبة ونتائجها. هذه السجلات ستصبح لاحقاً مختبرك الشخصي لفهم ما ينجح مع كل نموذج.
المتطلبات السابقة:
- خبرة أساسية في استخدام ChatGPT أو Claude أو Gemini أو أداة مشابهة.
- القدرة على وصف مهمة عملية تريد إنجازها.
- الاستعداد لاختبار أكثر من صياغة بدلاً من انتظار نتيجة مثالية من أول محاولة.
- لا يشترط امتلاك خبرة برمجية.
طريقة الدراسة المقترحة
- اختر مهمة واحدة ترافقك في جميع الوحدات، مثل إعداد تقرير أو تحليل بيانات أو كتابة مقال.
- نفّذ كل تمرين على المهمة نفسها لتلاحظ أثر كل تحسين.
- لا تغيّر النموذج والمطالبة معاً عند المقارنة؛ غيّر عاملاً واحداً كي تعرف سبب التحسن.
- أنشئ ملفاً لتسجيل النسخة، والمدخلات، والنتيجة، والأخطاء، والتعديل التالي.
- في نهاية الكورس نفّذ المشروع النهائي وقيّمه وفق المعيار من 100 نقطة.
الوحدة الأولى: بناء النموذج العقلي الصحيح
1. من مستخدم عادي إلى مستخدم متقدم
المستخدم العادي يعامل الذكاء الاصطناعي كأنه مربع بحث: يكتب سؤالاً قصيراً وينتظر إجابة. ينجح هذا الأسلوب مع التعريفات والمهام البسيطة، لكنه ينهار عندما تتطلب المهمة فهم هدف شخصي، أو مقارنة عدة وثائق، أو الالتزام بسياسة، أو إنتاج نتيجة تخضع لمعيار مؤسسي.
أما المستخدم المتقدم فيعامل النموذج كمتعاون ذكي جديد لا يعرف تفاصيل العمل بعد. لذلك يمنحه المهمة والسياق والمواد والمعايير، ويطلب منه توضيح الافتراضات أو كشف المعلومات الناقصة قبل التنفيذ. الفرق هنا ليس بلاغياً؛ إنه فرق في كمية الأدلة التي يستطيع النموذج استخدامها وفي وضوح القرار المطلوب منه.
مثلاً، مطالبة مثل:
أما المستخدم المتقدم فيعامل النموذج كمتعاون ذكي جديد لا يعرف تفاصيل العمل بعد. لذلك يمنحه المهمة والسياق والمواد والمعايير، ويطلب منه توضيح الافتراضات أو كشف المعلومات الناقصة قبل التنفيذ. الفرق هنا ليس بلاغياً؛ إنه فرق في كمية الأدلة التي يستطيع النموذج استخدامها وفي وضوح القرار المطلوب منه.
مثلاً، مطالبة مثل:
اكتب تقييماً ذاتياً جيداً أرسله إلى مديري.
ستنتج غالباً نصاً عاماً، لأن النموذج لا يعرف إنجازاتك أو مسؤولياتك أو الصعوبات التي واجهتها.
أما المسار المتقدم فيتضمن إرفاق سجل المشاريع، ومؤشرات الأداء، ورسائل الشكر، والمشكلات التي حُلّت، ثم طلب صياغة تقييم يربط كل إنجاز بأثر قابل للقياس. هكذا يتحول النموذج من مولّد عبارات إلى أداة تركيب وتحليل.
أما المسار المتقدم فيتضمن إرفاق سجل المشاريع، ومؤشرات الأداء، ورسائل الشكر، والمشكلات التي حُلّت، ثم طلب صياغة تقييم يربط كل إنجاز بأثر قابل للقياس. هكذا يتحول النموذج من مولّد عبارات إلى أداة تركيب وتحليل.
2. طبقات المعرفة التي يعتمد عليها النموذج
لفهم متى تثق بالنتيجة، ميّز بين أربع طبقات:
- المعرفة المدرّبة مسبقاً (Pretrained Knowledge): أنماط ومعلومات تعلّمها النموذج أثناء التدريب. تصلح غالباً للمفاهيم الثابتة والمعلومات الشائعة.
- السياق المقدم (Provided Context): النصوص والملفات والصور وسجل المحادثة الذي تعطيه للنموذج في المهمة الحالية.
- المعلومات المسترجعة (Retrieved Information): نتائج البحث أو قواعد المعرفة التي يجلبها النموذج عند الحاجة.
- نتائج الأدوات (Tool Results): الحسابات، وتشغيل الشيفرة، وقراءة الملفات، واستدعاءات الأنظمة الخارجية.
كلما زادت حساسية السؤال للوقت أو المكان أو البيانات الخاصة، قلّت كفاية المعرفة المدرّبة مسبقاً. سؤال عن مفهوم علمي مستقر قد لا يحتاج بحثاً، لكن سؤالاً عن قانون محلي أو سعر أو إصدار برمجي أو حدث وقع هذا الأسبوع يحتاج مصدراً حديثاً.
3. اختر الطبقة المناسبة بدلاً من تضخيم المطالبة
من الأخطاء الشائعة محاولة علاج نقص المعلومات بكلمات أقوى. إذا كان النموذج لا يملك بيانات المبيعات، فلن تعوض عبارة «حلل باحتراف شديد» غياب الملف. وإذا كان السؤال عن خبر جديد، فلن تجعل النبرة الواثقة المعرفة القديمة حديثة.
استخدم القاعدة التالية:
استخدم القاعدة التالية:
- معلومة عامة ثابتة: ابدأ بالمعرفة الداخلية.
- معلومة حديثة أو محلية أو نادرة: فعّل البحث في الويب.
- سؤال مركب يحتاج عشرات المصادر: استخدم البحث العميق.
- حسابات وجداول ورسوم: استخدم أداة تشغيل الشيفرة أو التحليل.
- مهمة تحتوي ملفاتك الخاصة: أرفقها أو امنح وصولاً محدوداً إليها.
- مهمة تنفذ أفعالاً: استخدم وكيلاً بصلاحيات محدودة وموافقات بشرية.
عندما ينتقل النظام من تقديم النصائح إلى تنفيذ الأفعال، يصبح من المهم فهم الفرق بين وكيل الذكاء الاصطناعي والمساعد الذكي؛ لأن الخطأ في الإجابة يختلف جذرياً عن الخطأ في حذف ملف أو إرسال رسالة.
💡 تمرين الوحدة الأولى: اكتب عشر مهام تستخدم فيها الذكاء الاصطناعي، ثم صنف كل مهمة وفق الطبقة المناسبة: معرفة داخلية، سياق مرفق، بحث، بحث عميق، شيفرة، أو تنفيذ بأدوات. إذا احتاجت المهمة أكثر من طبقة، رتّبها زمنياً.
💡 تمرين الوحدة الأولى: اكتب عشر مهام تستخدم فيها الذكاء الاصطناعي، ثم صنف كل مهمة وفق الطبقة المناسبة: معرفة داخلية، سياق مرفق، بحث، بحث عميق، شيفرة، أو تنفيذ بأدوات. إذا احتاجت المهمة أكثر من طبقة، رتّبها زمنياً.
الوحدة الثانية: تشريح المطالبة الاحترافية
1. العناصر السبعة للمطالبة
يمكن بناء مطالبة قوية عبر سبعة عناصر. لا يلزم أن تظهر كلها في كل مهمة، لكن التفكير فيها يمنعك من نسيان عنصر حاسم.
- الهدف: ما القرار أو الأثر الذي تريد الوصول إليه؟
- السياق: ما الذي يجب أن يعرفه النموذج عن الحالة والجمهور والبيئة؟
- المهمة: ما الفعل المحدد المطلوب الآن؟
- المواد المرجعية: ما الملفات أو النصوص أو المصادر التي يجب الاعتماد عليها؟
- القيود: ما الحدود المتعلقة بالطول والنطاق واللغة والسياسة والوقت؟
- صيغة الإخراج: كيف يجب أن تُعرض النتيجة؟
- معايير النجاح: كيف نعرف أن النتيجة مقبولة؟
التعليمات الرسمية الحديثة تشدد على وضوح الحدود المنطقية بين أجزاء المطالبة، ويمكن استخدام العناوين أو وسوم XML للفصل بين التعليمات والمواد المرجعية والبيانات.[2]
2. لا تخلط بين الدور والهدف والمهمة
قولك «تصرّف كخبير تسويق» يحدد دوراً عاماً، لكنه لا يحدد ما تريد. الهدف قد يكون اختيار سوق، والمهمة قد تكون مقارنة ثلاث شرائح، والمخرج قد يكون جدول قرار. الدور مفيد عندما يوجه زاوية التحليل، لكنه لا يعوض الهدف أو البيانات.
قارن بين المطالبتين:
قارن بين المطالبتين:
تصرّف كخبير أعمال وحلل فكرتي.
قيّم فكرة خدمة توصيل متنقلة وفق حجم المشكلة، واستعداد العميل للدفع، وتكلفة التشغيل، والتميّز التنافسي. امنح كل معيار 20 نقطة، واذكر الأدلة المؤيدة والمعارضة، ثم اقترح تجربة منخفضة التكلفة لاختبار أكثر افتراض خطورة.
الثانية أفضل لأنها تحول «الخبرة» إلى سلوك يمكن مراجعته.
3. حوّل الصفات إلى شروط قابلة للقياس
كلمات مثل «ممتاز» و «احترافي» و «شامل» غامضة. قد يفسرها النموذج بطريقة مختلفة عنك. استبدلها بشروط يمكن التحقق منها:
- بدلاً من «مختصر»: بين 120 و 150 كلمة.
- بدلاً من «موثق»: استشهد بمصدر رسمي بعد كل ادعاء متغير.
- بدلاً من «سهل»: اشرح المصطلح عند ظهوره الأول وقدّم مثالاً واحداً.
- بدلاً من «منظم»: استخدم خمسة أقسام ثابتة وعناوين واضحة.
- بدلاً من «موضوعي»: اعرض الأدلة المؤيدة والمعارضة قبل التوصية.
4. افصل التعليمات عن البيانات
عندما تلصق مستنداً طويلاً، قد يختلط على النموذج ما هو أمر وما هو محتوى يجب تحليله. استخدم بنية واضحة، مثل:
<الهدف>
إعداد ملخص تنفيذي لاتخاذ قرار.
</الهدف>
<القيود>
لا تستخدم معلومات من خارج المستند. اذكر «غير متوفر» عند غياب البيانات.
</القيود>
<المستند>
[ألصق النص هنا]
</المستند>
<المخرج>
القرار، الأدلة، المخاطر، المعلومات الناقصة.
</المخرج>
لا توجد قداسة لوسوم XML، لكن فائدتها أنها تجعل الحدود صريحة ومتسقة. ويمكن استخدام عناوين عادية إذا كانت الأداة لا تعرض الوسوم جيداً.
5. قالب العناصر السبعة
الهدف: [النتيجة أو القرار المطلوب]
السياق: [الجمهور، الحالة، الخلفية، البيئة]
المهمة: [الفعل المطلوب الآن]
المواد: [الملفات أو النصوص أو الروابط المعتمدة]
القيود: [الطول، الزمن، اللغة، ما يجب تجنبه]
صيغة الإخراج: [جدول، تقرير، JSON، قائمة، خطة]
معايير النجاح: [شروط القبول القابلة للقياس]
قبل التنفيذ، اذكر المعلومات الناقصة التي قد تغيّر النتيجة جذرياً. إن لم توجد، نفّذ المهمة ثم افحص الناتج مقابل معايير النجاح.
💡 مختبر الوحدة الثانية: اختر مطالبة ضعيفة تستخدمها عادة. أعد كتابتها بالعناصر السبعة، ثم شغّل النسختين على النموذج نفسه. لا تسأل «أي نتيجة أجمل؟»، بل قارن الدقة والاكتمال والالتزام بالشكل وعدد الافتراضات غير المعلنة.
الوحدة الثالثة: هندسة السياق وإدارة المحادثة
1. ما هندسة السياق؟
هندسة السياق (Context Engineering) هي اختيار المعلومات التي يحتاجها النموذج، وتنظيمها، وتوقيت إدخالها، وتحديد ما يجب استبعاده. هندسة المطالبة تهتم بما تقوله للنموذج، أما هندسة السياق فتهتم بما يعرفه لحظة التنفيذ.
تخيّل أنك كلفت محللاً جديداً بمقارنة عقدين. صياغة التعليمات مهمة، لكن جودة العمل ستعتمد أيضاً على حصوله على العقدين الصحيحين، وسياسة الشركة، وأولوياتك، والموعد النهائي، والأجزاء التي لا يجوز تعديلها.
تخيّل أنك كلفت محللاً جديداً بمقارنة عقدين. صياغة التعليمات مهمة، لكن جودة العمل ستعتمد أيضاً على حصوله على العقدين الصحيحين، وسياسة الشركة، وأولوياتك، والموعد النهائي، والأجزاء التي لا يجوز تعديلها.
2. السياق المفيد مقابل السياق الكثير
النافذة الطويلة لا تعني أن حشوها بكل شيء هو الخيار الأفضل. أظهرت دراسة «الضياع في المنتصف» أن موضع المعلومة داخل السياقات الطويلة قد يؤثر في قدرة بعض النماذج على استخدامها، وأن الأداء قد ينخفض عندما تُدفن المعلومة المهمة في وسط مدخل طويل.[9]
عملياً، نظّم السياق بهذه الطريقة:
عملياً، نظّم السياق بهذه الطريقة:
- ضع الهدف والقيود الحرجة في البداية.
- قسّم المستندات إلى وحدات معنونة.
- أضف تعريفاً قصيراً لكل ملف وسبب أهميته.
- ضع الطلب التنفيذي النهائي بعد السياق.
- اطلب من النموذج الإشارة إلى الجزء الذي استند إليه عند القرارات الحساسة.
- احذف الملفات المتكررة والمعلومات القديمة وغير المرتبطة.
3. حزمة السياق الاحترافية
بدلاً من رفع ملفات عشوائية، أنشئ حزمة تتكون من:
- مذكرة المهمة: الهدف والجمهور والموعد والمخرج.
- مصدر الحقيقة: الوثائق التي يجب تقديمها على المعرفة العامة.
- أمثلة معيارية: نماذج جيدة وسيئة مع توضيح السبب.
- قاموس المصطلحات: تعريفات المؤسسة والاختصارات.
- قواعد القرار: ما الذي يُقبل ويُرفض ويُصعّد للبشر.
- معيار الجودة: قائمة الفحص أو Rubric.
هذا التنظيم يجعل تحديث جزء من النظام أسهل من إعادة كتابة مطالبة ضخمة.
4. متى تبدأ محادثة جديدة؟
ابدأ محادثة جديدة عندما تنتقل إلى مشروع غير مرتبط، أو تتغير الشخصية والجمهور جذرياً، أو يمتلئ السجل بتعليمات قديمة، أو تلاحظ أن النموذج يواصل استخدام افتراضات لم تعد صحيحة.
أما إذا كانت المهمة امتداداً مباشراً لما سبق، فاستمرار المحادثة يحفظ القرارات والتغذية الراجعة. عند الشك، اكتب ملخصاً للحالة الحالية وافتح محادثة جديدة بهذا الملخص والملفات الضرورية فقط.
أما إذا كانت المهمة امتداداً مباشراً لما سبق، فاستمرار المحادثة يحفظ القرارات والتغذية الراجعة. عند الشك، اكتب ملخصاً للحالة الحالية وافتح محادثة جديدة بهذا الملخص والملفات الضرورية فقط.
5. تقنية «خريطة السياق»
قبل إرسال المهمة، اكتب قائمة بكل معلومة يملكها خبير بشري ويحتاجها للإنجاز. صنفها إلى: ضرورية، مفيدة، غير مرتبطة. أرفق الضروري، وأضف المفيد عند الحاجة، واحذف غير المرتبط.
ثم اسأل النموذج قبل التنفيذ:
ثم اسأل النموذج قبل التنفيذ:
راجع السياق وحدد أي معلومة ناقصة يمكن أن تغيّر القرار أو تمنع تنفيذ المهمة بدقة. لا تسأل عن تحسينات شكلية؛ اسأل فقط عن المعلومات الجوهرية.
💡 تمرين الوحدة الثالثة: ابنِ حزمة سياق لإعداد تقرير إداري سنوي. حدّد الملفات، ومصدر الحقيقة، والأمثلة، والقواعد، ومعيار النجاح. بعد ذلك احذف أي ملف لا تستطيع شرح دوره في جملة واحدة.
الوحدة الرابعة: اختيار استراتيجية المطالبة حسب نوع النموذج
1. النماذج المباشرة ونماذج الاستدلال
ليست جميع النماذج متشابهة في طريقة الاستجابة. بعض النماذج يتفوق في تنفيذ تعليمات واضحة وسريعة، بينما صُممت نماذج الاستدلال (Reasoning Models) للتعامل مع الغموض والمشكلات متعددة الخطوات والقرارات التي تجمع معلومات متفرقة.
توضح إرشادات OpenAI أن النماذج المباشرة تلائم المهام المحددة عندما تكون السرعة والتكلفة مهمتين، في حين تلائم نماذج الاستدلال التخطيط وحل المشكلات المعقدة واتخاذ القرار تحت الغموض. وفي التطبيقات الواقعية قد يُستخدم نموذج للتخطيط وآخر لتنفيذ الخطوات المتكررة.[3]
هذا يعني أن نسخ المطالبة نفسها إلى كل نموذج ليس دائماً أفضل ممارسة. النموذج المباشر قد يحتاج تعليمات أكثر تفصيلاً، بينما قد يستفيد نموذج الاستدلال من هدف واضح وقيود ومعيار نجاح من دون فرض مسار ضيق عليه.
توضح إرشادات OpenAI أن النماذج المباشرة تلائم المهام المحددة عندما تكون السرعة والتكلفة مهمتين، في حين تلائم نماذج الاستدلال التخطيط وحل المشكلات المعقدة واتخاذ القرار تحت الغموض. وفي التطبيقات الواقعية قد يُستخدم نموذج للتخطيط وآخر لتنفيذ الخطوات المتكررة.[3]
هذا يعني أن نسخ المطالبة نفسها إلى كل نموذج ليس دائماً أفضل ممارسة. النموذج المباشر قد يحتاج تعليمات أكثر تفصيلاً، بينما قد يستفيد نموذج الاستدلال من هدف واضح وقيود ومعيار نجاح من دون فرض مسار ضيق عليه.
2. متى تستخدم Zero-shot؟
التعلم دون أمثلة (Zero-shot Prompting) يعني إعطاء المهمة والتعليمات من دون نموذج سابق للمخرج. استخدمه عندما تكون المهمة مألوفة، وصيغة الإخراج بسيطة، ولا توجد نبرة أو سياسة خاصة يصعب وصفها.
مثال:
مثال:
لخّص النص التالي في خمس نقاط، واجعل كل نقطة جملة واحدة، ولا تضف معلومات من خارج النص.
إذا فشل النموذج في النبرة أو التصنيف أو الشكل، انتقل إلى الأمثلة بدلاً من زيادة التوبيخ والتعليمات السلبية.
3. متى تستخدم Few-shot؟
التعلم بأمثلة قليلة (Few-shot Prompting) يعني عرض مدخلات ومخرجات نموذجية ليكتشف النموذج النمط المطلوب. تستخدم الأمثلة لضبط الصياغة والتصنيف والنطاق والشكل، وتوصي إرشادات Google باستخدام أمثلة محددة ومتنوعة عندما نحتاج إلى سلوك أكثر ثباتاً.[4]
اختر أمثلتك وفق القواعد التالية:
اختر أمثلتك وفق القواعد التالية:
- مثّل الحالة الطبيعية الأكثر تكراراً.
- أضف حالة حدية أو ملتبسة.
- أظهر الرفض الصحيح أو «غير متوفر» عند غياب المعلومات.
- اجعل جميع الأمثلة متسقة مع التعليمات.
- لا تستخدم مثالاً مثالياً بعيداً عن بيانات الاستخدام الحقيقية.
مثال تصنيف:
التصنيفات المسموحة: عاجل، عادي، يحتاج معلومات.
المدخل: «الخادم متوقف لجميع العملاء»
المخرج: عاجل
المدخل: «أرغب في تغيير لون الواجهة مستقبلاً»
المخرج: عادي
المدخل: «النظام لا يعمل»
المخرج: يحتاج معلومات
صنّف المدخل التالي فقط: [النص]
4. تقسيم المهمة إلى سلسلة مطالبات
عندما تتطلب المهمة البحث والتحليل والكتابة والمراجعة، لا تضغط كل شيء في مطالبة واحدة بالضرورة. يمكن استخدام سلسلة مطالبات (Prompt Chaining) بحيث يصبح ناتج كل مرحلة مدخلاً للمرحلة التالية.
مثال سير عمل بحثي:
مثال سير عمل بحثي:
- تحديد سؤال البحث والأسئلة الفرعية.
- جمع المصادر وتقييمها.
- إنشاء سجل الادعاءات.
- بناء الهيكل.
- كتابة المسودة من السجل.
- فحص الاستشهادات والأسلوب.
ميزة السلسلة أنها تكشف الخطأ في مرحلته. فإذا كانت المصادر ضعيفة، لا تحتاج إلى انتظار المقال النهائي حتى تكتشف المشكلة.
5. المخرجات المنظمة
إذا كان الناتج سيدخل إلى برنامج أو قاعدة بيانات، فلا تعتمد على عبارة «أعد النتيجة بصيغة JSON» فقط في الأنظمة الإنتاجية. استخدم المخرجات المنظمة (Structured Outputs) أو مخططاً رسمياً عندما تدعم المنصة ذلك، ثم تحقّق من القيم دلالياً؛ فالتزام البنية لا يضمن صحة المحتوى.[11]
أما في الاستخدام العادي، فيكفي غالباً تحديد الحقول بدقة:
أما في الاستخدام العادي، فيكفي غالباً تحديد الحقول بدقة:
أعد النتيجة بهذه الحقول حصراً:
العنوان:
المشكلة:
الأدلة:
المخاطر:
المعلومات الناقصة:
التوصية:
درجة الثقة من 1 إلى 5:
6. هل نطلب «فكّر خطوة بخطوة»؟
لا تجعل هذه العبارة قاعدة عامة. النماذج الحديثة قادرة على الاستدلال بطرق داخلية معقدة، وفرض سلسلة تفكير محددة قد لا يضيف قيمة. الأهم هو وصف المهمة، وتوفير السياق، وطلب فحص النتيجة وفق معيار واضح.
استخدم بدائل مثل:
استخدم بدائل مثل:
- حلّل القيود المتعارضة قبل التوصية.
- اختبر الحل على الحالات الحدية.
- راجع الحسابات باستخدام أداة مناسبة.
- قدّم النتيجة النهائية مع ملخص موجز للأدلة والافتراضات.
- لا تخمّن عند غياب معلومة حاسمة؛ صرّح بالنقص.
💡 مختبر الوحدة الرابعة: اختر مهمة مركبة، واكتب نسخة لنموذج مباشر تتضمن خطوات تنفيذية واضحة، ونسخة لنموذج استدلال تحدد الهدف والقيود ومعايير النجاح. قارن الدقة والوقت والتكلفة وعدد التصحيحات.
الوحدة الخامسة: مطالبات البحث والتحقق من المعلومات
1. ثلاث درجات للبحث
لا يحتاج كل سؤال إلى الإنترنت، ولا يحتاج كل بحث إلى عشرات المصادر. استخدم ثلاث درجات:
- الإجابة من المعرفة الداخلية: للمبادئ المستقرة والتعريفات العامة.
- البحث في الويب: للحقائق الحديثة أو المحلية أو النادرة، وغالباً يعتمد على عدد محدود من الصفحات.
- البحث العميق (Deep Research): للأسئلة المركبة التي تتطلب خطة بحث، وعدة استعلامات، ومقارنة مصادر كثيرة، ثم تقريراً موثقاً.
النظام الجيد لا يختار البحث بسبب طول السؤال، بل بسبب نوع المعلومات اللازمة. مقارنة سعر منتج اليوم قد تكون سؤالاً قصيراً لكنه يحتاج بحثاً. أما شرح مبدأ رياضي ثابت فقد يكون طويلاً ولا يحتاج الويب.
2. بنية مطالبة البحث الاحترافية
سؤال البحث: [السؤال المركزي]
النطاق: [ما الذي يدخل وما الذي لا يدخل]
الزمن والمكان: [الفترة، الدولة، السوق]
الأسئلة الفرعية: [3 إلى 5 أسئلة]
أولوية المصادر: [رسمية، أبحاث محكمة، جهات تنظيمية]
المصادر المستبعدة: [محتوى مجهول، صفحات تسويق، مصادر قديمة]
معالجة التعارض: اعرض الخلاف ولا تقدمه كحقيقة محسومة.
المخرج: تقرير منظم مع استشهاد بعد كل ادعاء متغير.
التحقق: افتح المصادر الكاملة وتأكد أن كل استشهاد يدعم الجملة فعلاً.
هذه البنية تمنع النموذج من جمع أول نتائج شائعة فقط، وتجعله يميّز بين جودة المصدر وشهرته.
3. هرم المصادر
رتب المصادر وفق طبيعة الادعاء:
- الوثائق الرسمية والبيانات الأولية والنصوص التنظيمية.
- الأبحاث المحكمة وقواعد البيانات الأكاديمية.
- المؤسسات المهنية المعروفة.
- الصحافة ذات المعايير التحريرية الواضحة.
- خبراء متخصصون ذوو خبرة موثقة.
- المدونات والمنتديات والتجارب الشخصية، وتستخدم للسياق لا لإثبات الادعاءات الحساسة.
لا يعني المصدر الرسمي أنه يجيب عن كل سؤال، ولا يعني المصدر الشعبي أنه عديم القيمة. المطلوب هو ملاءمة نوع المصدر للادعاء. تجربة مستخدم قد تفيد في فهم مشكلة واجهة، لكنها لا تثبت سلامة علاج أو قانونية إجراء.
4. البحث العميق بوصفه عملية وكيلة
يعمل البحث العميق عادة عبر خطة ثم عدة عمليات بحث وقراءة ومقارنة قبل كتابة التقرير. وتوضح وثائق OpenAI أن ربط البحث العميق بالويب أو الملفات أو خوادم الأدوات يوسع القدرة، لكنه يضيف مخاطر مثل حقن التعليمات وتسريب البيانات، لذلك يجب الفصل بين المصادر العامة والبيانات الخاصة وتسجيل استدعاءات الأدوات.[5]
قبل بدء البحث العميق، راجع الخطة. هل تغطي الأسئلة الصحيحة؟ هل توجد مصادر أولية؟ هل النطاق أوسع من اللازم؟ تعديل خطة من عشرة أسطر أسهل من تصحيح تقرير طويل بُني على سؤال خاطئ.
قبل بدء البحث العميق، راجع الخطة. هل تغطي الأسئلة الصحيحة؟ هل توجد مصادر أولية؟ هل النطاق أوسع من اللازم؟ تعديل خطة من عشرة أسطر أسهل من تصحيح تقرير طويل بُني على سؤال خاطئ.
5. سجل الادعاءات
سجل الادعاءات (Claim Ledger) هو قائمة تربط كل حقيقة مهمة بمصدرها وحالتها. يمكن أن يتضمن:
- الادعاء.
- نوعه: ثابت، متغير، رأي منسوب، استنتاج.
- المصدر الأساسي.
- مصدر التحقق الثاني عند الحاجة.
- تاريخ المصدر.
- درجة الثقة.
- ملاحظة عن التعارض أو القيود.
اطلب من النموذج إنشاء السجل قبل الكتابة. بهذه الطريقة لا يتحول البحث إلى قائمة روابط منفصلة عن النص.
6. التحقق من الاستشهادات
لا تكتفِ بوجود رابط. افتح الصفحة واسأل:
- هل يدعم المصدر الادعاء نفسه أم موضوعاً قريباً فقط؟
- هل التاريخ هو تاريخ الحدث أم تاريخ نشر الصفحة؟
- هل الرقم يمثل المجتمع والفترة والوحدة المذكورة؟
- هل اقتُطع الاستنتاج من سياقه؟
- هل للمصدر مصلحة تجارية تؤثر في عرضه؟
💡 مشروع الوحدة الخامسة: اختر سؤالاً حديثاً، وابنِ مطالبة بحث، ثم اطلب سجل ادعاءات من خمسة عناصر. افتح ثلاثة مصادر يدوياً، وسجّل هل كان الاستشهاد صحيحاً وكاملاً أم مضللاً.
الوحدة السادسة: استخدام الذكاء الاصطناعي شريكاً للتفكير
1. العصف الذهني ليس طلب قائمة طويلة
المطالبة «أعطني 50 فكرة» قد تنتج عدداً كبيراً من الخيارات المتشابهة. العصف الذهني الاحترافي عملية تفاعلية: تقدم السياق، وتطلب خيارات متنوعة، وتقيّمها، ثم تعيد توجيه النموذج بناءً على ما تعلمته من الجولة الأولى.
استخدم التسلسل التالي:
استخدم التسلسل التالي:
- اشرح المشكلة والقيود والموارد.
- اطلب من ثلاثة إلى خمسة اتجاهات مختلفة، لا خمسين عنواناً.
- اطلب توضيح الفرضية والمخاطر لكل اتجاه.
- اختر ما يعجبك وما ترفضه مع ذكر السبب.
- أضف سياقاً جديداً كشفته الخيارات.
- اطلب جولة ثانية أكثر تركيزاً.
- ادمج أفضل العناصر في خطة واحدة.
التغذية الراجعة ليست مجرد تصحيح؛ إنها سياق جديد يكشف تفضيلاتك وأولوياتك للنموذج.
2. دفع النموذج خارج الإجابات النمطية
للحصول على أفكار أكثر تنوعاً، حدّد فئات مختلفة:
- حل محافظ منخفض المخاطر.
- حل متوازن قابل للتنفيذ خلال شهر.
- حل جريء يغيّر الافتراض الأساسي.
- حل يستخدم مورداً موجوداً بطريقة غير معتادة.
- حل يبدأ بتجربة صغيرة قبل الاستثمار.
يمكن أيضاً طلب «أفكار غير متداخلة» وشرح الفرق الجوهري بينها. هذا أفضل من زيادة العدد بلا ضابط.
3. التملق الآلي
التملق الآلي (Sycophancy) هو ميل النموذج إلى موافقة المستخدم أو مجاراة اعتقاده بدلاً من تقديم التقييم الأكثر صدقاً. أظهرت أبحاث على نماذج مدربة بالتغذية الراجعة البشرية أن مطابقة معتقد المستخدم قد تُفضّل أحياناً على الإجابة الأكثر صحة.[8]
يظهر التملق عندما تقول:
يظهر التملق عندما تقول:
لدي فكرة تجارية رائعة. أثبت لي لماذا ستنجح.
أنت هنا قدمت الاستنتاج قبل التحليل. الأفضل:
قيّم الفكرة التالية من دون افتراض نجاحها أو فشلها. استخدم المعايير المحددة، واعرض أقوى دليل مؤيد وأقوى اعتراض، ثم حدد أكثر افتراض يحتاج إلى اختبار.
4. صياغة السؤال المحايد
استبدل السؤال الموجه بسؤال مقارن أو مفتوح:
- بدلاً من «أليس العمل عن بُعد أكثر إنتاجية؟» استخدم «كيف تقارن الإنتاجية بين العمل عن بُعد والعمل المكتبي وفق نوع المهمة؟»
- بدلاً من «هل توافق أن هذه الخطة ممتازة؟» استخدم «ما نقاط القوة والضعف وفق المعايير التالية؟»
- بدلاً من «ابحث عن مؤشرات النجاح» استخدم «ابحث عن مؤشرات التحسن والتراجع والعوامل التي قد تفسرهما».
5. النقد باستخدام Rubric
سُلّم التقييم (Rubric) يحول الحكم العام إلى معايير منفصلة. مثال لتقييم فكرة مشروع من 100:
- وضوح المشكلة: 20 نقطة.
- وجود مستخدم مستعد للدفع: 20 نقطة.
- قابلية الوصول إلى السوق: 15 نقطة.
- الميزة التنافسية: 15 نقطة.
- الجدوى التشغيلية: 15 نقطة.
- المخاطر القانونية والأمنية: 10 نقاط.
- إمكانية اختبار الفرضية بتكلفة منخفضة: 5 نقاط.
عرّف معنى الدرجة الكاملة والدرجة الصفرية لكل معيار. ثم اطلب احتساب الدرجات بعد التقييم لا قبله، حتى لا يختار النموذج رقماً ثم يبحث عن تبرير.
6. المراجعة المتقاطعة
يمكن أن تكتب المسودة بنموذج وتراجعها بنموذج آخر. هذا لا يضمن الحقيقة، لكنه يضيف زاوية مختلفة وقد يكشف افتراضات أو تناقضات. استخدم معياراً واحداً لكلا النموذجين، وإلا ستقارن أسلوبين لا جودتين.
💡 مختبر الوحدة السادسة: قيّم فكرة أو خطة مرتين: مرة بسؤال موجه، ومرة بسؤال محايد مع Rubric. سجّل الفرق في الدرجة، والأدلة، وعدد الاعتراضات، ومدى قابلية التوصيات للتنفيذ.
💡 مختبر الوحدة السادسة: قيّم فكرة أو خطة مرتين: مرة بسؤال موجه، ومرة بسؤال محايد مع Rubric. سجّل الفرق في الدرجة، والأدلة، وعدد الاعتراضات، ومدى قابلية التوصيات للتنفيذ.
الوحدة السابعة: الكتابة والتحرير بنظام تدريجي
1. لماذا ينتج الطلب المباشر نصاً سطحياً؟
عندما تقول «اكتب مقالاً عن موضوع ما»، يضطر النموذج إلى تخمين الجمهور والزاوية والبنية والأدلة والنبرة. قد تكون كل جملة سليمة منفردة، لكن النص النهائي يكرر أفكاراً عامة ولا يقدم موقفاً واضحاً. هذا هو جوهر ما يوصف أحياناً بالمحتوى السطحي المولد آلياً.
العلاج ليس قائمة كلمات ممنوعة فقط، بل فصل التفكير عن الصياغة. ابدأ بتحديد الرسالة، ثم الهيكل، ثم الأدلة، ثم المسودة.
العلاج ليس قائمة كلمات ممنوعة فقط، بل فصل التفكير عن الصياغة. ابدأ بتحديد الرسالة، ثم الهيكل، ثم الأدلة، ثم المسودة.
2. التخطيط التدريجي
التخطيط التدريجي (Progressive Outlining) يمر بالمراحل التالية:
- تعريف القارئ والمشكلة والنتيجة المطلوبة.
- إنشاء ثلاثة هياكل بزوايا مختلفة.
- اختيار الهيكل ونقده بحثاً عن التكرار والفجوات.
- تحويل كل عنوان إلى ادعاءات وأدلة وأمثلة.
- فحص ترتيب الحجة والانتقالات.
- كتابة المسودة قسماً بعد قسم.
- تحرير البنية ثم الحقائق ثم الأسلوب.
تعديل سطر في الهيكل قد يغيّر مئات الكلمات قبل كتابتها، لذلك تكون المراجعة في هذه المرحلة عالية الأثر.
3. قالب كتابة أكاديمي تطبيقي
الموضوع: [الموضوع]
القارئ: [المستوى والحاجة]
الرسالة المركزية: [ما الذي يجب أن يفهمه أو يفعله]
زاوية المقال: [التميّز عن المحتوى الموجود]
المصادر: [سجل الادعاءات المعتمد]
المرحلة 1: اقترح ثلاثة هياكل غير متداخلة.
المرحلة 2: قيّمها وفق التغطية والتسلسل والأصالة.
المرحلة 3: ابنِ الهيكل المختار مع هدف كل قسم.
المرحلة 4: أضف لكل قسم الادعاءات والأدلة والمثال.
لا تكتب المسودة قبل موافقتي على الهيكل.
4. التحرير على طبقات
لا تطلب «حسّن المقال» من دون تحديد نوع التحسين. نفّذ جولات منفصلة:
- جولة البنية: هل لكل قسم وظيفة؟ هل يوجد تكرار أو قفزة منطقية؟
- جولة الحقائق: هل الادعاءات مدعومة؟ هل الاستشهادات تطابقها؟
- جولة الوضوح: هل المصطلحات معرفة والأمثلة كافية؟
- جولة الأسلوب: هل النبرة متسقة والجمل طبيعية؟
- جولة الاختصار: هل يمكن حذف جملة من دون فقد معنى؟
- جولة النشر: هل العناوين والروابط والبيانات الوصفية مكتملة؟
5. تحرير جزء صغير في كل مرة
عند معالجة نص طويل، اطلب مراجعة فقرة أو قسم مع حفظ الهدف العام في السياق. هذا يسهل مقارنة النسخ ويمنع النموذج من تغيير مواضع سليمة لمجرد أنه طُلب منه «إعادة الكتابة».
مثال:
مثال:
راجع الفقرة التالية من حيث الدقة والوضوح فقط. لا تغيّر النبرة أو تضف معلومات جديدة. اعرض: المشكلة، سببها، نسخة محسنة، وما الذي تغير.
6. تحويل المطالبة الناجحة إلى مهارة
إذا نجح سير العمل مراراً وأصبح له مدخلات وخطوات ومخرجات ثابتة، يمكن تحويله إلى مهارة أو قالب تشغيلي. يشرح دليل كتابة المهارات Skills باحتراف كيفية توثيق شروط التفعيل والخطوات ومعايير النجاح وحالات الفشل، بدلاً من إعادة كتابة التعليمات في كل مرة.
💡 مشروع الوحدة السابعة: اختر فكرة مقال. أنشئ ثلاثة هياكل، ثم Rubric من خمسة معايير لاختيار الأفضل، ثم نقاطاً تفصيلية لقسم واحد، ثم مسودة. لا تنتقل إلى مرحلة حتى تراجع السابقة.
💡 مشروع الوحدة السابعة: اختر فكرة مقال. أنشئ ثلاثة هياكل، ثم Rubric من خمسة معايير لاختيار الأفضل، ثم نقاطاً تفصيلية لقسم واحد، ثم مسودة. لا تنتقل إلى مرحلة حتى تراجع السابقة.
الوحدة الثامنة: المطالبات متعددة الوسائط وتحليل البيانات
1. ما المطالبة متعددة الوسائط؟
المطالبة متعددة الوسائط (Multimodal Prompting) تستخدم أكثر من نوع من المدخلات أو المخرجات، مثل النص والصورة والصوت والفيديو والملفات والجداول. الفائدة ليست في التنوع بحد ذاته، بل في اختيار الوسيط الذي ينقل السياق بأقل غموض.
قد يكون وصف رسم بياني معقد بالكلمات أقل دقة من رفع الصورة، وقد يكون تلخيص اجتماع أسهل عند إرفاق التسجيل والنص والملاحظات. لكن كل وسيط يضيف احتمالات خطأ مختلفة، لذلك يجب تحديد ما الذي ينبغي استخراجه وما الذي يحتاج تحققاً بشرياً.
قد يكون وصف رسم بياني معقد بالكلمات أقل دقة من رفع الصورة، وقد يكون تلخيص اجتماع أسهل عند إرفاق التسجيل والنص والملاحظات. لكن كل وسيط يضيف احتمالات خطأ مختلفة، لذلك يجب تحديد ما الذي ينبغي استخراجه وما الذي يحتاج تحققاً بشرياً.
2. استخدام الصور بوصفها سياقاً
يمكن للنموذج تفسير المشاهد، وقراءة نصوص واضحة، ومقارنة واجهات، واستخراج عناصر من إيصال أو مخطط. ومع ذلك قد يخطئ في التفاصيل الدقيقة، أو النص الصغير، أو الأشياء المتشابهة بصرياً، أو الأرقام ذات الأثر المالي.
اكتب مطالبة الصورة بهذه البنية:
اكتب مطالبة الصورة بهذه البنية:
المهمة: [ما الذي تريد معرفته من الصورة]
النطاق: [العناصر التي يجب التركيز عليها]
التحقق: لا تستنتج نصاً غير مقروء. ضع علامة [غير واضح] بدلاً من التخمين.
المخرج: [جدول أو وصف أو قائمة أخطاء]
الصورة المرجعية: [أرفق الصورة]
إذا كانت الصورة وثيقة حساسة، أزل البيانات غير الضرورية قبل رفعها، ولا تجعل النموذج المصدر الوحيد لحسابات أو قرارات عالية المخاطر.
3. تصميم مطالبة إنشاء صورة
تتكون المطالبة البصرية الجيدة من:
- الموضوع الرئيسي: ما العنصر أو المشهد؟
- التكوين: أين توضع العناصر وما العلاقة بينها؟
- الأسلوب: واقعي، إنفوجرافيك، مائي، تقني، سينمائي.
- الإضاءة والألوان: الجو البصري ولوحة الألوان.
- زاوية المشاهدة: أمامية، علوية، قريبة، واسعة.
- النصوص: الكلمات المطلوبة ولغتها ومكانها.
- نسبة الأبعاد: مثل 16:9 أو 4:3 أو 1:1.
- القيود السلبية: العناصر الممنوعة أو الأخطاء الواجب تجنبها.
مثال:
صمم إنفوجرافيك عربيًا احترافياً يوضح انتقال المطالبة من الهدف إلى السياق ثم الأدوات فالتقييم. خلفية بيضاء، بطاقات زرقاء وخضراء هادئة، أسهم واضحة، أيقونات تعليمية، نص عربي مقروء، أسلوب أكاديمي حديث، نسبة 16:9، من دون شعارات تجارية أو عناصر زخرفية مزدحمة.
4. بناء تطبيق بسيط من مطالبة
عند طلب بناء تطبيق، لا تكتفِ بفكرة عامة. عرّف:
- الهدف الذي يحله التطبيق.
- المستخدم المستهدف.
- المدخلات التي يدخلها المستخدم.
- المخرجات والتفاعلات.
- حالات الخطأ والبيانات الناقصة.
- منصة التشغيل.
- معايير القبول.
قالب مختصر:
ابنِ تطبيق ويب بسيطاً لمقارنة نسختين من مطالبة.
المدخلات: المطالبة الأولى، المطالبة الثانية، معايير التقييم.
المخرجات: درجات منفصلة، الفروق، والتوصية.
التفاعل: زر تشغيل، زر مسح، وإمكانية تصدير النتيجة.
القيود: يعمل محلياً، واجهة عربية، لا يرسل البيانات إلى طرف ثالث.
معيار القبول: جميع الحقول تعمل، وتظهر رسالة مفهومة عند غياب أي مدخل.
قبل كتابة الشيفرة، اعرض خطة الملفات والمنطق للاعتماد.
5. تحليل البيانات وتشغيل الشيفرة
عند رفع جدول، اطلب من النموذج فحص البنية قبل التحليل. قد تحتوي البيانات على قيم ناقصة أو أعمدة بأسماء ملتبسة أو وحدات مختلفة. إذا بدأ الرسم مباشرة، قد ينتج استنتاجاً أنيقاً مبنياً على تفسير خاطئ.
مطالبة تحليل احترافية:
مطالبة تحليل احترافية:
افحص الملف أولاً واذكر عدد الصفوف والأعمدة، وأنواع البيانات، والقيم الناقصة، والتكرارات، وأي تناقض في الوحدات.
لا تحذف أو تعدّل البيانات قبل شرح الإجراء.
بعد الموافقة، احسب المؤشرات المطلوبة باستخدام الشيفرة، واعرض الرسم المناسب، واذكر الافتراضات.
تحقق من ثلاثة أرقام رئيسية بحساب مستقل قبل كتابة الاستنتاج.
سلّم ملخصاً تنفيذياً، ومنهج التحليل، والنتائج، والقيود.
الذكاء الاصطناعي قد يكتب شيفرة صحيحة ويستخرج أنماطاً مفيدة، لكنه لا يعرف تلقائياً معنى كل عمود داخل عملك. لذلك تبقى المعرفة بالمجال ومراجعة النتائج ضروريتين.
💡 مختبر الوحدة الثامنة: استخدم صورة أو جدولاً حقيقياً غير حساس. اطلب تحليلاً أولياً فقط، ثم راجع ما فهمه النموذج، وصحح المعاني، وبعدها اطلب التنفيذ. قارن النتيجة بما يحدث عند طلب التحليل الكامل من أول خطوة.
الوحدة التاسعة: تقييم المطالبات وبناء نظام موثوق
1. لماذا لا تكفي نتيجة ناجحة واحدة؟
النماذج التوليدية متغيرة؛ قد تعطي صياغة مختلفة للمدخل نفسه، وقد تنجح المطالبة على مثال وتفشل على حالة أخرى. لهذا لا تُقيّم المطالبة بانطباع «تبدو جيدة»، بل على مجموعة حالات تمثل الاستخدام الحقيقي.
تعرّف التقييمات (Evals) بأنها اختبارات منظمة لقياس الدقة والموثوقية والأداء رغم الطبيعة غير الحتمية للنماذج. وتوصي إرشادات OpenAI بالتقييم المبكر والمستمر، وبإدخال الحالات الطبيعية والحدية والعدائية، لا الاكتفاء بأمثلة سهلة.[7]
تعرّف التقييمات (Evals) بأنها اختبارات منظمة لقياس الدقة والموثوقية والأداء رغم الطبيعة غير الحتمية للنماذج. وتوصي إرشادات OpenAI بالتقييم المبكر والمستمر، وبإدخال الحالات الطبيعية والحدية والعدائية، لا الاكتفاء بأمثلة سهلة.[7]
2. ابدأ بمعايير النجاح
قبل تحسين المطالبة، عرّف النجاح. تؤكد وثائق Anthropic أن معايير النجاح ينبغي أن تكون محددة وقابلة للقياس ومرتبطة باحتياجات الاستخدام، وأن عملية بناء الاختبارات والتحسين التكراري تقع في صميم هندسة المطالبات.[6]
يمكن أن تشمل المعايير:
يمكن أن تشمل المعايير:
- دقة الحقائق.
- استرجاع السياق الصحيح.
- الالتزام بصيغة الإخراج.
- اكتمال الحقول.
- النبرة والأسلوب.
- سلامة الاستشهادات.
- حماية الخصوصية.
- الزمن والتكلفة.
لا تستخدم عشرة معايير متساوية لمجرد الشمول. أعط وزناً أكبر لما يسبب فشله ضرراً حقيقياً.
3. بناء مجموعة الاختبار
مجموعة التقييم الجيدة تتضمن:
- حالات طبيعية: أمثلة تمثل أغلب الاستخدام.
- حالات حدية: نص طويل جداً، قيمة صفرية، لغة مختلطة، ملف ناقص.
- حالات غامضة: مدخل يحتمل أكثر من تفسير.
- حالات تعارض: مصدران أو تعليمات متناقضة.
- حالات رفض: طلب خارج النطاق أو يخالف السياسة.
- حالات عدائية: محاولة تغيير التعليمات أو استخراج بيانات.
ابدأ بعشر حالات حقيقية، ثم أضف كل فشل جديد إلى المجموعة. بمرور الوقت تصبح أخطاء النظام السابقة جزءاً من دفاعه المستقبلي.
4. طرق التقييم
- التقييم البرمجي: لفحص وجود الحقول، وصحة JSON، والطول، والتطابق مع قائمة.
- التقييم البشري: للمعنى والنبرة والملاءمة والقرارات المعقدة.
- التقييم بواسطة نموذج: لتطبيق Rubric على نطاق كبير، مع معايرته بأحكام بشرية.
- المقارنة الثنائية: عرض نتيجتين واختيار الأفضل وفق معيار محدد.
النماذج تكون غالباً أفضل في التمييز بين بديلين أو التصنيف وفق معايير من إعطاء حكم مفتوح بلا مرجع، لذلك تكون المقارنة الثنائية أكثر ثباتاً في كثير من الحالات.[7]
5. بطاقة اختبار مطالبة
اسم المطالبة: [الاسم]
الإصدار: [1.0]
الهدف: [المهمة]
النموذج: [الاسم والإصدار]
حالة الاختبار: [المدخل]
النتيجة المتوقعة: [الشروط]
النتيجة الفعلية: [الملخص]
الدرجة: [حسب Rubric]
نوع الفشل: [سياق، تعليمات، أداة، نموذج، بيانات]
التعديل المقترح: [تغيير واحد]
نتيجة إعادة الاختبار: [نجح/فشل]
6. لا تعالج كل فشل بالمطالبة
قد تكون المشكلة في البيانات، أو النموذج، أو الأداة، أو تصميم النظام. استخدم شجرة القرار التالية:
- إذا كان الهدف غامضاً: حسّن التعليمات.
- إذا كانت المعلومات ناقصة: حسّن السياق أو الاسترجاع.
- إذا كانت الصيغة غير ثابتة: استخدم مخطط مخرجات منظم.
- إذا كانت المهمة تحتاج معرفة حديثة: فعّل البحث.
- إذا كانت الحسابات خاطئة: استخدم الشيفرة والتحقق.
- إذا كان السلوك متكرراً على نطاق واسع: فكّر في الضبط الدقيق بعد وجود بيانات تقييم.
- إذا كانت المهمة متعددة الأفعال: صمم سير عمل أو وكيلاً مع حدود.
7. إدارة الإصدارات
لا تستبدل المطالبة القديمة بلا سجل. احفظ رقم الإصدار، وسبب التغيير، والحالات التي أصلحها، والحالات التي تراجعت. شغّل مجموعة الاختبارات على كل تعديل مهم، لأن تحسين حالة قد يفسد أخرى.
💡 مشروع الوحدة التاسعة: أنشئ عشر حالات اختبار لمطالبة واحدة، وحدد Rubric من أربعة معايير. اختبر النسخة الحالية، ثم عدّل عنصراً واحداً فقط، وأعد الاختبار. ارفض التعديل إذا رفع المتوسط لكنه تسبب في فشل حرج.
الوحدة العاشرة: الأمان والصلاحيات والمراجعة البشرية
1. من الإجابة إلى الفعل
عندما يكتب النموذج نصاً، يمكن مراجعته قبل الاستخدام. لكن عندما يصل إلى البريد والملفات وقواعد البيانات وأدوات الدفع، يصبح الخطأ إجراءً حقيقياً. لذلك يجب تصميم الأمان ضمن المهمة لا إضافته بعد وقوع المشكلة.
2. مبدأ أقل صلاحية
امنح النظام أقل صلاحية لازمة:
- مجلد مشروع واحد بدلاً من القرص الكامل.
- القراءة بدلاً من التعديل إذا كانت المهمة تحليلية.
- إنشاء مسودة بدلاً من الإرسال المباشر.
- الوصول المؤقت بدلاً من الدائم.
- أداة محددة بدلاً من مجموعة أدوات واسعة.
قسّم الصلاحيات إلى القراءة والإنشاء والتعديل والحذف والنشر. السماح بأحدها لا يعني السماح بالبقية.
3. نقاط الموافقة البشرية
اجعل الموافقة إلزامية قبل:
- حذف ملف أو سجل.
- إرسال رسالة إلى طرف خارجي.
- نشر محتوى باسم المؤسسة.
- إجراء شراء أو دفع.
- تغيير صلاحيات المستخدمين.
- استخدام بيانات حساسة في خدمة خارجية.
أفضل سير عمل في المهام الحساسة هو: اقرأ، حلّل، اقترح خطة، اعرض التغييرات، انتظر الموافقة، ثم نفّذ مع سجل واضح.
4. حقن المطالبات
حقن المطالبات (Prompt Injection) يحدث عندما تحتوي مدخلات المستخدم أو صفحة أو ملف على تعليمات تغيّر سلوك النموذج بصورة غير مقصودة. قد يكون الحقن مباشراً في رسالة المستخدم أو غير مباشر داخل مصدر خارجي يقرأه الوكيل.
تضع OWASP حقن المطالبات في صدارة مخاطر تطبيقات النماذج اللغوية لعام 2025، وتوضح أنه قد يؤدي إلى كشف معلومات أو استخدام وظائف غير مصرح بها أو تنفيذ أوامر في الأنظمة المتصلة.[10]
تضع OWASP حقن المطالبات في صدارة مخاطر تطبيقات النماذج اللغوية لعام 2025، وتوضح أنه قد يؤدي إلى كشف معلومات أو استخدام وظائف غير مصرح بها أو تنفيذ أوامر في الأنظمة المتصلة.[10]
5. تقليل الخطر عملياً
- عامل محتوى الويب والملفات على أنه بيانات غير موثوقة لا تعليمات.
- افصل البيانات الخاصة عن البحث العام قدر الإمكان.
- قيّد الأدوات والوجهات التي يمكن للوكيل الاتصال بها.
- تحقق من المعاملات قبل تنفيذ الأداة.
- سجل استدعاءات الأدوات والرسائل الحساسة.
- لا تسمح للنموذج بإرسال الأسرار أو مفاتيح API.
- استخدم بيئة تجريبية قبل النظام الحقيقي.
- اجعل العمليات غير القابلة للتراجع تحتاج موافقة بشرية.
لا يوجد حاجز واحد يمنع كل هجوم؛ الأمان طبقات تجمع بين تقييد الصلاحيات والتحقق والعزل والمراقبة.
6. قائمة فحص قبل تشغيل وكيل
- هل الهدف محدد ويمكن إيقافه؟
- هل الصلاحيات أقل ما يمكن؟
- هل الملفات والمصادر موثوقة؟
- هل توجد موافقة قبل الأفعال الحساسة؟
- هل يستطيع المستخدم مشاهدة الخطة والتغييرات؟
- هل توجد حدود للوقت والخطوات والتكلفة؟
- هل يوجد سجل يمكن مراجعته؟
- هل اختُبر النظام على حقن مباشر وغير مباشر؟
- هل توجد نسخة احتياطية للملفات القابلة للتعديل؟
⚠️ تحذير: لا تمنح وكيلاً جديداً صلاحية حذف أو إرسال أو دفع على بيئة حقيقية قبل اختباره في نطاق معزول ومراجعة جميع الأفعال المتوقعة.
💡 تمرين الوحدة العاشرة: اختر وكيلاً افتراضياً لتنظيم ملفاتك. صمم له ثلاث درجات: قراءة فقط، اقتراح تغييرات، تنفيذ بعد الموافقة. اكتب ما الذي يستطيع فعله وما الذي يمنع عنه في كل درجة.
💡 تمرين الوحدة العاشرة: اختر وكيلاً افتراضياً لتنظيم ملفاتك. صمم له ثلاث درجات: قراءة فقط، اقتراح تغييرات، تنفيذ بعد الموافقة. اكتب ما الذي يستطيع فعله وما الذي يمنع عنه في كل درجة.
المشروع النهائي: بناء نظام مطالبة احترافي
اختر مهمة حقيقية تتكرر في عملك، مثل إعداد تقرير، أو تحليل فكرة، أو كتابة مقال موثق، أو مراجعة عقود غير حساسة، أو تحليل ملف مبيعات، أو بناء تطبيق داخلي بسيط.
المرحلة الأولى: تعريف المشكلة
اكتب في صفحة واحدة:
- من المستخدم النهائي؟
- ما القرار أو الناتج المطلوب؟
- ما تكلفة الخطأ؟
- ما البيانات المتاحة؟
- ما الذي يجب أن يبقى تحت مراجعة بشرية؟
لا تبدأ بالمطالبة قبل هذه الإجابات؛ لأن جودة النظام تُبنى على تعريف المهمة.
المرحلة الثانية: بناء السياق
اجمع مصدر الحقيقة، والأمثلة، والقواعد، وقاموس المصطلحات. ضع وصفاً لكل ملف، واحذف المتكرر والقديم. حدّد بوضوح هل يُسمح للنموذج باستخدام معرفة خارجية أو بحث الويب.
المرحلة الثالثة: اختيار الاستراتيجية
قرر:
- هل تحتاج نموذجاً مباشراً أم نموذج استدلال؟
- هل ستستخدم Zero-shot أم Few-shot؟
- هل المهمة مطالبة واحدة أم سلسلة؟
- هل تحتاج بحثاً أو شيفرة أو أداة؟
- هل الناتج نص حر أم بنية ثابتة؟
المرحلة الرابعة: كتابة النسخة الأولى
استخدم قالب العناصر السبعة، واجعل كل قيد مرتبطاً بسبب أو خطر. تجنب التعليمات المكررة والمتعارضة. أضف سلوكاً واضحاً للمعلومات الناقصة: سؤال، أو «غير متوفر»، أو تصعيد بشري.
المرحلة الخامسة: بناء الاختبارات
أنشئ عشر حالات على الأقل: خمس طبيعية، حالتان حديتان، حالة غامضة، حالة تعارض، وحالة عدائية. اكتب النتيجة المقبولة قبل تشغيل المطالبة حتى لا تغيّر معيارك بعد رؤية الناتج.
المرحلة السادسة: التحسين
حلّل كل فشل وحدد مصدره. غيّر عنصراً واحداً، ثم أعد جميع الاختبارات. لا تضف قاعدة لكل خطأ صغير؛ ابحث عن السبب المشترك الذي يعالج فئة كاملة من الأخطاء.
المرحلة السابعة: التوثيق والتحويل إلى أصل قابل لإعادة الاستخدام
وثّق:
- اسم النظام والغرض.
- المدخلات المطلوبة.
- خطوات التنفيذ.
- الأدوات والصلاحيات.
- صيغة الإخراج.
- معايير النجاح.
- حالات الفشل.
- رقم الإصدار وتاريخ آخر اختبار.
عند هذه المرحلة لم تعد تملك مطالبة جيدة فقط، بل عملية يمكن لفريقك تشغيلها ومراجعتها وتحسينها.
معيار تقييم المشروع من 100 نقطة
- وضوح الهدف والجمهور: 10 نقاط.
- جودة السياق ومصدر الحقيقة: 15 نقطة.
- دقة المهمة والتعليمات: 15 نقطة.
- القيود وصيغة الإخراج: 10 نقاط.
- اختيار النموذج والأدوات: 10 نقاط.
- معايير النجاح: 10 نقاط.
- تنوع حالات الاختبار: 10 نقاط.
- التحقق من الحقائق والنتائج: 10 نقاط.
- الأمان والخصوصية: 5 نقاط.
- التوثيق وقابلية إعادة الاستخدام: 5 نقاط.
شرط النجاح: لا تعتمد النظام إذا حصل على أقل من 80 نقطة، أو إذا فشل في أي حالة أمنية حرجة مهما كان متوسطه مرتفعاً.
مكتبة قوالب عملية جاهزة
قالب البحث الموثق
ابحث عن [الموضوع] ضمن [الفترة والمكان].
أجب عن: [الأسئلة الفرعية].
قدّم المصادر الأولية والرسمية، ثم الأبحاث المحكمة، ثم المصادر المهنية.
لا تعتمد على مقتطفات نتائج البحث أو صفحات تسويقية لإثبات الادعاءات.
أنشئ سجل ادعاءات أولاً، واذكر التعارضات وعدم اليقين.
بعد ذلك اكتب تقريراً منظماً مع استشهاد يدعم كل حقيقة متغيرة.
قالب النقد المحايد
قيّم العمل المرفق من دون افتراض أنه جيد أو سيئ.
استخدم المعايير التالية وأوزانها: [المعايير].
لكل معيار: اذكر الدليل، والدرجة، وأهم تحسين.
اعرض أقوى نقطتي قوة وأخطر نقطتي ضعف.
احسب الدرجة النهائية بعد إكمال التقييمات الفرعية.
لا تمدح الصياغة ما لم ترتبط بمعيار واضح.
قالب العصف الذهني متعدد الجولات
السياق: [المشكلة والموارد والقيود].
اقترح خمسة اتجاهات غير متداخلة: محافظ، منخفض التكلفة، سريع، مبتكر، وتجريبي.
لكل اتجاه: الفرضية، الفائدة، المخاطر، وأول اختبار.
لا تختر الأفضل الآن.
سأعطيك تغذية راجعة، ثم أنشئ جولة ثانية تستفيد منها من دون تكرار الخيارات المرفوضة.
قالب تحليل البيانات
افحص الملف ولا تبدأ التحليل النهائي.
اعرض بنية البيانات، والقيم الناقصة، والتكرار، والوحدات، والمشكلات المحتملة.
اسأل فقط عن المعاني التي تغير التحليل.
بعد التأكيد، نفّذ الحسابات بالشيفرة، وارسم المؤشرات المناسبة، وتحقق من الأرقام الحرجة.
قدّم النتائج والافتراضات والقيود، ولا تفسر الارتباط على أنه سببية.
قالب اختبار المطالبة
الهدف: [الهدف].
معايير النجاح: [المعايير والأوزان].
أنشئ 10 حالات: طبيعية، حدية، غامضة، متعارضة، وعدائية.
شغّل المطالبة على الحالات إن أمكن.
صنّف كل فشل إلى: تعليمات، سياق، بيانات، أداة، نموذج، أمان.
اقترح أصغر تعديل يعالج السبب، ثم أعد الاختبار الكامل.
أخطاء متقدمة يجب تجنبها
- تضخيم المطالبة بلا حاجة: كثرة التعليمات قد تخلق تناقضات وتدفن القيود المهمة.
- الخلط بين غياب المعرفة وضعف الصياغة: بعض المهام تحتاج بيانات أو بحثاً لا كلمات أقوى.
- استخدام أمثلة غير متسقة: النموذج يتعلم النمط الفعلي في الأمثلة حتى لو خالف التعليمات.
- تقييم النتيجة بالانطباع: الجملة الجميلة لا تعني أن الادعاء صحيح.
- تحسين المتوسط وتجاهل الفشل الحرج: نجاح 95% لا يكفي إذا كانت 5% تشمل تسريباً أو حذفاً.
- تغيير عدة عوامل معاً: لن تعرف هل التحسن من النموذج أم السياق أم المطالبة.
- دفن المعلومة الحاسمة في ملف طويل: نظّم السياق واطلب الاستشهاد بالموضع المستخدم.
- إجبار النموذج على الإجابة: أضف خيار «غير متوفر» واطلب ذكر النقص.
- منح صلاحيات واسعة للراحة: سهولة الإعداد لا تبرر الوصول الكامل.
- تثبيت مطالبة وعدم إعادة اختبارها: النماذج والأدوات تتغير، وقد يتغير السلوك معها.
الأسئلة الشائعة حول هندسة المطالبات
س: هل ما زالت هندسة المطالبات مهمة مع تطور النماذج؟
ج: نعم، لكن طبيعتها تغيرت. النماذج الأقوى تقلل الحاجة إلى الحيل اللفظية، وتزيد أهمية تحديد الهدف والسياق والأدوات ومعايير النجاح. كلما أصبح النموذج أكثر قدرة على التنفيذ، أصبحت جودة تصميم المهمة والضوابط والتقييم أهم من حفظ جملة سحرية.
س: هل المطالبة الأطول أفضل دائماً؟
ج: لا. الطول مفيد عندما يضيف سياقاً أو قيوداً أو أمثلة ضرورية. أما التكرار والتعليمات المتعارضة والمعلومات غير المرتبطة فتزيد الضوضاء. اسأل عن كل سطر: هل سيقل احتمال الخطأ إذا بقي؟ إن لم يكن له أثر واضح، فاختصره.
س: ما الفرق بين هندسة المطالبات وهندسة السياق؟
ج: هندسة المطالبات تصمم التعليمات والتفاعل، بينما هندسة السياق تختار ما يصل إلى النموذج من ملفات وذاكرة ومصادر ونتائج أدوات. في المهمة البسيطة قد تكفي المطالبة، أما النظام المتقدم فيحتاج إلى الاثنين معاً.
س: متى أستخدم Zero-shot ومتى أستخدم Few-shot؟
ج: ابدأ بـ Zero-shot عندما تكون المهمة واضحة ومألوفة. استخدم Few-shot عندما تحتاج إلى شكل ثابت أو تصنيف خاص أو نبرة دقيقة أو معالجة حالات حدية. الأمثلة الجيدة لا تزين المطالبة؛ بل تعرّف النموذج عملياً بما يعنيه النجاح.
س: هل أطلب من النموذج أن يفكر خطوة بخطوة؟
ج: ليست قاعدة عامة للنماذج الحديثة. الأفضل وصف التعقيد والقيود، وطلب تحليل متأنٍ وفحص للنتيجة، ثم الحصول على خلاصة الأدلة والافتراضات. لا تعتمد على كشف سلسلة تفكير مطولة بوصفها دليلاً على الصحة؛ اختبر الناتج نفسه.
س: كيف أعرف أن المشكلة في المطالبة وليست في النموذج؟
ج: اختبر المهمة على أكثر من صياغة مع تثبيت النموذج، ثم على نموذج آخر مع تثبيت المدخلات. إذا فشلت جميع الصياغات بسبب نقص معلومة، فالمشكلة سياق. إذا فشل نموذج ونجح آخر باستمرار، فالمشكلة قدرة. وإذا تغير الشكل فقط، فقد تحتاج مخرجات منظمة أو أمثلة.
س: هل يمكن منع الهلوسة نهائياً؟
ج: لا يمكن ضمان ذلك في كل استخدام، لكن يمكن خفضها بتوفير مصدر حقيقة، وتفعيل البحث عند الحاجة، وإجبار الاستشهادات، والسماح بعبارة «غير متوفر»، واستخدام الشيفرة للحسابات، والتحقق البشري من الادعاءات الحساسة.
س: كيف أحصل على نقد صادق؟
ج: استخدم سؤالاً محايداً، وأخفِ تفضيلك إن لم يكن ضرورياً، وقدّم Rubric واضحاً، واطلب الأدلة المؤيدة والمعارضة. اطلب الدرجة بعد التحليل، لا قبله، وقارن النتيجة بتقييم بشري أو نموذج ثانٍ عندما تكون المهمة مهمة.
س: هل تصلح المطالبة نفسها لكل النماذج؟
ج: المبادئ العامة تنتقل، لكن التفاصيل قد تختلف. بعض النماذج يفضل التعليمات المباشرة والأمثلة، وبعضها ينجح مع هدف مرتفع المستوى. اختبر على النموذج الفعلي، ولا تعتمد على وصفة نُشرت لنموذج مختلف أو إصدار قديم.
س: متى أحول المطالبة إلى Skill أو سير عمل؟
ج: عندما تتكرر المهمة، وتثبت المدخلات والخطوات والمخرجات، وتصبح لديك حالات اختبار ومعايير نجاح. المطالبة الفردية تصلح للتجربة، أما المهارة فتصلح لتوثيق العملية وتوحيدها بين المستخدمين والأدوات.
س: هل يمكن للنموذج تقييم مخرجاته بنفسه؟
ج: يمكنه اكتشاف بعض العيوب عند إعطائه معياراً واضحاً، لكن التقييم الذاتي ليس مستقلاً تماماً. استخدمه مرحلة أولى، ثم أضف اختبارات برمجية أو مراجعة بشرية أو مقارنة نموذجية بحسب أهمية المهمة.
س: ما أهم سؤال قبل إرسال أي مطالبة؟
ج: «ما المعلومات والمعايير التي يحتاجها خبير بشري جديد ليؤدي هذه المهمة جيداً؟» هذا السؤال يكشف عادةً نقص السياق وغموض الهدف قبل أن تلوم النموذج على النتيجة.
خلاصة القول: من كتابة الأوامر إلى تصميم العمل
هندسة المطالبات بالذكاء الاصطناعي ليست سباقاً لكتابة أطول أمر، ولا مجموعة كلمات سر تحفظها. إنها ممارسة تجمع تعريف الهدف، وهندسة السياق، واختيار الأدوات، وتصميم المخرجات، وبناء التقييمات، وحماية الصلاحيات.
المستخدم المتوسط يعرف كيف يطلب نتيجة أفضل. أما المستخدم المتقدم فيعرف كيف يبني عملية تنتج نتائج قابلة للمراجعة، ويكشف سبب الفشل، ويعيد الاختبار، ويقرر متى يحتاج إلى البحث أو الشيفرة أو التدخل البشري.
ابدأ اليوم بمهمة واحدة تتكرر في عملك. اكتب معيار النجاح قبل المطالبة، وابنِ عشر حالات اختبار، وحسّن نسخة واحدة في كل مرة. بعد ذلك شاركنا المطالبة والنتائج والدروس المستفادة في منتديات شباب الرافدين؛ فالقيمة الحقيقية لا تظهر في القالب وحده، بل في طريقة اختباره وتطويره.
تذكر دائما كما يقول Chat GPT: هندسة المطالبات هي تصميم التفكير والعمل، لا مجرد كتابة النص.
دمتم بود!
المستخدم المتوسط يعرف كيف يطلب نتيجة أفضل. أما المستخدم المتقدم فيعرف كيف يبني عملية تنتج نتائج قابلة للمراجعة، ويكشف سبب الفشل، ويعيد الاختبار، ويقرر متى يحتاج إلى البحث أو الشيفرة أو التدخل البشري.
ابدأ اليوم بمهمة واحدة تتكرر في عملك. اكتب معيار النجاح قبل المطالبة، وابنِ عشر حالات اختبار، وحسّن نسخة واحدة في كل مرة. بعد ذلك شاركنا المطالبة والنتائج والدروس المستفادة في منتديات شباب الرافدين؛ فالقيمة الحقيقية لا تظهر في القالب وحده، بل في طريقة اختباره وتطويره.
تذكر دائما كما يقول Chat GPT: هندسة المطالبات هي تصميم التفكير والعمل، لا مجرد كتابة النص.
دمتم بود!
المصادر والمراجع
- DeepLearning.AI. "AI Prompting for Everyone." DeepLearning.AI، 2026.
- OpenAI. "Prompt Engineering." OpenAI Developer Documentation، تاريخ الاطلاع 26 يونيو 2026.
- OpenAI. "Reasoning Best Practices." OpenAI Developer Documentation، تاريخ الاطلاع 26 يونيو 2026.
- Google. "Prompt Design Strategies." Google AI for Developers، يونيو 2026.
- OpenAI. "Deep Research." OpenAI Developer Documentation، تاريخ الاطلاع 26 يونيو 2026.
- Anthropic. "Define Success Criteria and Build Evaluations." Claude Platform Docs، تاريخ الاطلاع 26 يونيو 2026.
- OpenAI. "Evaluation Best Practices." OpenAI Developer Documentation، تاريخ الاطلاع 26 يونيو 2026.
- Mrinank Sharma وآخرون. "Towards Understanding Sycophancy in Language Models." Anthropic Research، 20 أكتوبر 2023.
- Nelson F. Liu وآخرون. "Lost in the Middle: How Language Models Use Long Contexts." Transactions of the Association for Computational Linguistics، 2024.
- OWASP GenAI Security Project. "LLM01:2025 Prompt Injection." OWASP، 2025.
- OpenAI. "Structured Model Outputs." OpenAI Developer Documentation، تاريخ الاطلاع 26 يونيو 2026.





