من يوجّه مَن؟ الإنسان أم الذكاء الاصطناعي؟

نظرة عامة على RAG هندسة الأوامر وتقنيات وكلاء الذكاء الاصطناعي

المقدمة

في عصرنا الرقمي الحالي، لم تعد التكنولوجيا مجرد أدوات نستخدمها، بل أصبحت كيانات تتفاعل معنا وتفهم لغتنا. في قلب هذا التطور، تكمن نماذج الذكاء الاصطناعي الحديثة، التي أتقنت فن المحادثة البشرية. لكن كيف تطورت لتصل إلى هذه المرحلة؟ وما هي التحديات التي واجهتها في الطريق، مثل “الهلوسة” (Hallucination)؟

و للحديث أكثر عن هذا الموضوع تم التطرق اه في جلسة استضافتها مؤسسة سند الشباب التنموية، قدّمت المهندسة مروة الداية عرضاً شيقاً حول التحولات التي أحدثتها نماذج اللغة الكبيرة (LLMs) في الذكاء الاصطناعي. أوضحت كيف تطورت هذه النماذج من التنبؤ بالكلمات إلى فهم السياق، والإجابة الدقيقة، وتنفيذ مهام معقدة تشبه التفكير البشري

جدول المحتويات

  1. نماذج اللغة الكبيرة (LLMs) وتحدياتها
  2. مفهوم RAG (Retrieval-Augmented Generation)
  3. بنية أنظمة RAG
  4. أدوات وفوائد RAG
  5. أساسيات هندسة الأوامر (Prompt Engineering)
  6. أنماط صياغة الأوامر
  7. مفاهيم الوكلاء الذكيين (AI Agents)
  8. قدرات الأدوات الخاصة بالوكلاء
  9. مستقبل الوكلاء الذكيين

1.  ما هو LLMs وما أبرز التحديات التي تواجهه؟

نماذج اللغة الكبيرة (Large Language Models – LLMs) هي نماذج ذكاء اصطناعي قادرة على فهم اللغات الطبيعية. أطلق عليها “كبيرة” لأنها تدربت على كميات ضخمة من البيانات والمعلومات.

التحدي الأكبر: “الهلوسة” (Hallucination)

هي حالة تحدث عندما يُطلب من النموذج الإجابة على أسئلة لم يتدرب عليها مسبقًا، مما يؤدي إلى نتائج مزيفة أو غير دقيقة لا علاقة لها بالموضوع المطروح. يمكن تشبيهها بحالة “الهلوسة” حيث يبدأ النموذج في تقديم معلومات خاطئة أو عشوائية.

بارمترات التحكم في أداء LLMs

منخفضة: إجابات دقيقة وواقعية

عالية: إجابات إبداعية ومتنوعة

تحدد عدد أو نسبة الكلمات المحتملة للاختيار منها، حيث تقليلها يزيد من التركيز والدقة، وزيادتها تزيد التنوع.

يحدد الحد الأقصى لطول النص المولد لضمان الإيجاز وتقليل التكلفة.

2. ما هو RAG (Retrieval-Augmented Generation)؟

RAG هو آلية تربط نماذج اللغة الكبيرة (LLMs) بمصادر بيانات خارجية (External Data) لتجنب مشكلة الهلوسة. إذ تُزوّد هذه النماذج بالمعلومات الصحيحة التي تحتاجها للإجابة على الأسئلة، ما يزيد من دقة المخرجات وثقة المستخدم بالمعلومة.

توفير حقائق موثوقة لبناء الإجابات عليها

تقليل فرص الهلوسة

لكن قد تكون مكلفة من حيث الموارد عند الحاجة إلى تدريب النموذج ليتوافق مع البيانات الجديدة

  • قواعد المعرفة (Knowledge Bases): ملفات PDF، مستندات، قواعد بيانات، وصفحات ويب
  • نماذج التضمين (Embedding Models): تحويل النصوص إلى متجهات رقمية باستخدام تقنيات مثل DPR وSentence-Transformers
  • قاعدة البيانات المتجهة (Vector Database): تخزين وفهرسة المتجهات للبحث السريع باستخدام أدوات مثل FAISS وPinecone
  • وحدة الاستخراج (Retriever Module): تحويل الاستفسارات إلى متجهات واستخراج المحتوى ذي الصلة
  • نموذج اللغة المولد (LLM Generator): إنتاج الإجابة النهائية بناءً على السياق المستخرج والسؤال الأصلي

يقوم النظام بتقسيم المستندات إلى قطع صغيرة، ثم يحولها إلى متجهات رقمية تُخزن في قاعدة بيانات متجهة. عند وصول سؤال، يتم تحويله إلى متجه والبحث عن أكثر القطع الصلة في قاعدة البيانات. تُدمج هذه المعلومات مع السؤال الأصلي وتُرسل إلى نموذج اللغة الكبير لإنتاج إجابة دقيقة ومدعومة بالمصادر

  1. تقسيم البيانات إلى قطع مناسبة بحيث لا تتجاوز حدود التوكن ولا تفقد السياق
  2. تحسين سرعة الاستجابة عبر التخزين المؤقت (caching) للطلبات المتكررة
  1. قطع البيانات بذكاء وليس عشوائياً
  2. اختيار الأجزاء الأهم فقط
  3. صياغة الأسئلة بشكل مضبوط
  4. تأمين وحماية البيانات
  5. استخدام أدوات سريعة وتجهيز البيانات مسبقاً
  • أطر العمل: LangChain، LlamaIndex
  • قواعد البيانات المتجهة: Pinecone، FAISS، Weaviate، ChromaDB، Milvus
  • نماذج التضمين: Sentence-Transformers، OpenAI Embeddings، Cohere Embed
  • نماذج التوليد: GPT، Claude، Gemini، Mistral، LLaMA

3. هندسة الأوامر (Prompt Engineering)

هي عملية توجيه وضبط مدخلات نماذج اللغة الكبيرة (LLMs) للحصول على مخرجات صحيحة ومناسبة.

 Instruction: التعليمة الواضحة (مثل: “لخص” أو “حلل”)

Context:السياق الذي ينتمي له الموضوع (مالي، تقني، … )

Input :البيانات المُرسلة للنموذج (نص، ملف، … )

Output: شكل المخرجات المطلوبة (ملف، JSON، قائمة ..)

  1. تحسين دقة المخرجات
  2. تقليل الهدر في التوكن وبالتالي تقليل التكلفة
النوعمتى يُستخدمالإيجابياتالسلبيات
بدون أمثلة (Zero-Shot)المهام البسيطة، المعرفة العامة، التجارب الأوليةسريع، لا يحتاج إلى إعداددقة منخفضة، تحكم أقل في التنسيق أو المخرجات
مثال واحد (One-Shot)عندما تعرف تنسيق المخرجات وتريد توجيه النموذج بشكل بسيطيضيف وضوحاًقد لا يكون مثال واحد كافياً
أمثلة متعددة (Few-Shot)المهام المعقدة، الحاجة لنبرة/هيكل محدد، أو دقة عالية مطلوبةتحكم عالي، نتائج متسقةيتطلب أمثلة مجهزة بشكل جيد

إعطاء دور محدد لنموذج اللغة ليعمل على أساسه، ليصبح له لهجته وأسلوبه الخاص ويستهدف جمهوراً معيناً.

مثال:

أنت مدرب لياقة بدنية متعاون ومشجع، هدفك مساعدة الناس على تحسين صحتهم البدنية. نبرتك إيجابية ومحفزة، تستخدم كلمات بسيطة ومفهومة، وتراعي مستوى اللياقة للمبتدئين.

4. هندسة الأوامر المتقدمة

تساعد هذه الأساليب النماذج على التفكير المنطقي والتخطيط والتفاعل بكفاءة أعلى، خاصة في المهام متعددة الخطوات والمعقدة.

النوعالهدفمثال عملي
Chain-of-Thought (CoT)سلسلة التفكيرالتفكير خطوة بخطوةتوجيه النموذج لحل المسألة أو المشكلة بتفصيل كل خطوة. مثال: “ما هو حاصل ضرب 18 × 27؟ دعنا نفكر خطوة بخطوة…”ثم يبدأ النموذج بالتفكيك: 18 × 20 = 360، 18 × 7 = 126، ثم يجمع = 486
Tree-of-Thought (ToT)شجرة الأفكاراستكشاف مسارات متعددة للتفكيريقوم النموذج باقتراح عدة حلول أو أفكار في وقت واحد، ويقيّم كل واحدة للوصول لأفضل خيار. مثال: لحل لغز ذكاء، يبدأ بعدة مسارات، ويقارن بين نتائج كل مسار لاختيار الأفضل
ReAct (Reasoning +  Acting)تفكير + تنفيذالتفكير أولاً، ثم استخدام أدواتيشرح النموذج تفكيره، ثم ينفذ إجراءً باستخدام أداة مثل البحث أو حاسبة أو API مثال: “ما هو أرخص لابتوب بمواصفات معينة؟”  يفكر، ثم يبحث على الإنترنت، ثم يعرض النتائج
Self-Consistencyالاتساق الذاتيتكرار نفس التلقين واختيار الإجابة الشائعةيعيد النموذج حل نفس السؤال عدة مرات بتنوع بسيط، ثم يختار الإجابة التي تتكرر أكثر. مثال: يُطلب منه حل لغز منطقي 5 مرات، ثم تُختار الإجابة الأكثر تكراراً باعتبارها الأكثر موثوقية

اي اننا هل نكثر من المنع او نكثؤ من التغليمات التي يجب فعلها
الحل الوحيد هو الموازنة وفقا ل نوعية البيانات المعطاة وتجنبا لعدم انحياز الموديل باتجاه معين .

النوعما هو؟مثالالفائدة
Instructions (التوجيهات)تخبر النموذج بما يجب عليه فعلهاذكر 3 مزايا في نقاط.”توجيه مباشر لإنتاج محتوى منظم وذو هدف
Constraints (القيود / التلقين السلبي)تخبر النموذج بما يجب عليه تجنبهلا تذكر أسماء المنتجات.”تمنع النتائج غير المرغوبة أو المخالفة للسياسة

5. الوكلاء الذكيون (AI Agents)

هو نظام ذكي قادر على اتخاذ قرارات والعمل بشكل مستقل لتحقيق أهداف محددة، وليس مجرد توليد نصوص أو التعرف على الأنماط.

  • الاستقلالية: العمل بدون تدخل بشري مستمر
  • الهدفية: وجود هدف واضح
  • التفاعل: التكيف مع البيئة والتعلم منها
  • التنفيذ: القدرة على تنفيذ إجراءات محددة (مثل إرسال بريد إلكتروني، حجز موعد)
  • الوكلاء التقليديون: يعتمدون على قواعد محددة أو تعليمات مبرمجة مسبقاً، جيدون في المهام البسيطة والواضحة، لكنهم يواجهون صعوبة في فهم اللغة أو التعامل مع مواقف غير واضحة أو غامضة.
  • الوكلاء المدعومون بنماذج اللغة الكبيرة: يستخدمون ذكاء اصطناعي متطور (نماذج كبيرة مثل ChatGPT) للتفكير والتعامل مع مواقف معقدة، يمكنهم التكيف والتفكير في مجالات مختلفة.
  • الإدراك: يستطيع الوكيل فهم ما يراه أو يسمعه أو يقرأه، مثل النصوص أو الصور أو الصوت.
  • التفكير والتخطيط: يضع خطة منطقية لتحقيق هدف معين.
  • الذاكرة: يتذكر المعلومات والتجارب السابقة لتحسين أدائه.
  • استخدام الأدوات: يتفاعل مع قواعد بيانات، تطبيقات، وأجهزة مختلفة لإنجاز المهام.
  • التعلم والتكيف: يغير سلوكه حسب تفاعل المستخدم وتجارب سابقة.
  • لزيادة الإنتاجية بتوفير الوقت والجهد في المهام المتكررة أو المعقدة.
  • لاتخاذ قرارات أفضل بالتعاون مع وكلاء آخرين.
  • لحل مشاكل معقدة عن طريق التخطيط واستخدام أدوات مختلفة.
  • لتقديم دعم شخصي يتكيف مع احتياجات المستخدم، أحيانًا حتى قبل أن يطلب المساعدة.
  1. الإدراك: يستقبل هدفًا أو طلبًا.
  2. التفكير: يقسم الهدف إلى خطوات صغيرة.
  3. التنفيذ: يستخدم أدوات مختلفة لتنفيذ خطوة.
  4. الملاحظة: يراقب نتائج التنفيذ.
  5. التكرار: يكرر هذه الخطوات حتى ينجز الهدف..

التوجيهات هي التعليمات التي تحدد شخصية الوكيل، أهدافه، القواعد التي يتبعها، وكيف يستخدم الأدوات، مثل تحديد أنه مساعد ذكي يساعد في البحث عن أفضل عروض السفر.

  •  Hopper :يتوقع أسعار الطيران والفنادق.
  •  Google Gemini Assistant : مساعد ذكي متكامل مع التطبيقات المختلفة.
  • Bixby وGoogle Assistant : أتمتة ذكية مثل التذكير التلقائي.
  •  Talk2Care : مساعد صوتي في المجال الصحي.
  • Google Lens ,Apple Live Text : يبحثون ويترجمون ويعرفون الأشياء من الصور.
  • هناك أدوات برمجية متقدمة تسمح للمطورين بالتحكم الكامل في الوكلاء.
  • وهناك منصات تسهل الربط بين الخدمات دون الحاجة لكتابة أكواد كثيرة.
  • السوق يتوسع بسرعة كبيرة من 5.4 مليار دولار في 2024 إلى أكثر من 50 مليار دولار بحلول 2030.
  • الوكلاء يستخدمون في مجالات كثيرة مثل الصحة، المالية، التسويق، وخدمات الشركات

نشهد اليوم لحظة فارقة في تاريخ الذكاء الاصطناعي؛ حيث تتحول النماذج اللغوية الكبيرة من مجرد مولّدات نصوص إلى وكلاء ذكيين قادرين على التفكير واتخاذ القرار والعمل المستقل. مع التقنيات الحديثة مثل RAG وهندسة الأوامر المتقدمة، ونموذج الوكلاء، يُفتح الباب أمام ثورة حقيقية في كيفية تفاعلنا مع الآلات.

يبقى السؤال: من يوجّه من؟ هل الإنسان هو من يتحكم بهذه الوكلاء الذكية، أم أن هذه الوكلاء ستصبح شريكة حقيقية لنا في صنع المستقبل؟

المراجع :


Udemy: LangChain + LlamaIndex

Grand View Research: AI Agents Market Report

Coursera: Fundamentals of AI Agents Using RAG and LangChain

ZeroToMastery: AI Engineer Bootcamp (RAG)

Prompting Guide

Stanford, Google AI, Meta AI Research (arXiv)

LangChain Documentation

LlamaIndex Documentation

IBM Developer Blog – What are AI Agents?

UPTIQ Docs – AI Agents vs LLM Apps

Zilliz BlogMulti-agent Frameworks

IBM Think Blog – ReAct Agents

HowToBuySaaSLLM Agent Systems

MediumLow-Code Agent Builders

Google Cloud Codelab – Flutter + Vertex AI Agents

YouTube: LLM Agents Explained

YouTube: Agent Frameworks Compared

ألبوم الصور


اكتشاف المزيد من Mobile Dev Meetup

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك رد