من النماذج اللغوية إلى «الهلوسة»: دليلك الشامل لفهم لغة الذكاء الاصطناعي اليوم

مدخل إلى لغة العصر الرقمي الجديد

يعد عالم الذكاء الاصطناعي مجالاً عميقاً ومعقداً، وغالباً ما يعتمد العلماء والمطورون فيه على مصطلحات تقنية متخصصة لشرح ابتكاراتهم. ونتيجة لذلك، نجد أنفسنا في تغطيتنا الصحفية مضطرين لاستخدام هذه المصطلحات بشكل متكرر. لذا، أعددنا هذا الدليل ليكون مرجعاً يوضح أهم المفاهيم والعبارات التي نستخدمها في مقالاتنا، لمساعدة القراء على مواكبة هذا التحول الجذري.

سنعمل على تحديث هذا القاموس بانتظام لإضافة مدخلات جديدة مع استمرار الباحثين في اكتشاف طرق مبتكرة لدفع حدود الذكاء الاصطناعي وتحديد مخاطر السلامة الناشئة.

الذكاء الاصطناعي العام (AGI)

مصطلح «الذكاء الاصطناعي العام» لا يزال فضفاضاً إلى حد ما، لكنه يشير عموماً إلى ذكاء اصطناعي يتفوق على متوسط قدرات البشر في مهام متعددة، إن لم يكن معظمها. وصف سام ألتمان، الرئيس التنفيذي لشركة OpenAI، هذا المفهوم مؤخراً بأنه «ما يعادل زميل عمل بشري متوسط القدرات». في المقابل، يعرف ميثاق OpenAI هذا الذكاء بأنه «أنظمة ذاتية التشغيل للغاية تتفوق على البشر في معظم الأعمال ذات القيمة الاقتصادية». بينما يرى مختبر Google DeepMind أنه «ذكاء قادر على الأداء بمستوى البشر على الأقل في معظم المهام الإدراكية».

وكيل الذكاء الاصطناعي (AI Agent)

يشير وكيل الذكاء الاصطناعي إلى أداة تستخدم تقنيات الذكاء الاصطناعي لأداء سلسلة من المهام نيابة عنك – بما يتجاوز قدرات روبوتات الدردشة التقليدية – مثل معالجة المصاريف، أو حجز التذاكر، أو حتى كتابة الأكواد البرمجية وصيانتها. المفهوم الأساسي هنا هو «النظام المستقل» الذي قد يعتمد على أنظمة ذكاء اصطناعي متعددة لتنفيذ مهام معقدة متعددة الخطوات.

التفكير المتسلسل (Chain-of-Thought Reasoning)

عندما يُسأل الإنسان سؤالاً بسيطاً، فإنه يجيب تلقائياً. لكن المسائل المعقدة تتطلب خطوات وسيطة (مثل حل معادلة رياضية). في سياق الذكاء الاصطناعي، يعني «التفكير المتسلسل» للنماذج اللغوية الكبيرة تقسيم المشكلة إلى خطوات أصغر لتحسين جودة النتيجة النهائية. تستغرق هذه النماذج وقتاً أطول للرد، لكن الإجابة تكون أكثر دقة، خاصة في سياق المنطق أو البرمجة، حيث يتم تحسينها عبر «التعلم التعزيزي».

القدرات الحوسبية (Compute)

يشير هذا المصطلح إلى القوة الحسابية الحيوية التي تسمح لنماذج الذكاء الاصطناعي بالعمل. تُستخدم الكلمة غالباً كاختصار للأجهزة والعتاد الذي يوفر هذه القوة، مثل وحدات معالجة الرسومات (GPUs)، ووحدات المعالجة المركزية (CPUs)، والبنية التحتية التي تشكل حجر الزاوية لصناعة الذكاء الاصطناعي الحديثة.

التعلم العميق (Deep Learning)

هو فرع من فروع تعلم الآلة يعتمد على بنية «الشبكات العصبية الاصطناعية» متعددة الطبقات، والمستوحاة من ترابط الخلايا العصبية في دماغ الإنسان. تتيح هذه البنية للأنظمة إجراء ارتباطات معقدة والتعلم من أخطائها وتحسين مخرجاتها ذاتياً دون تدخل بشري مكثف، لكنها تتطلب كميات هائلة من البيانات وتكاليف تطوير عالية.

الانتشار (Diffusion)

التقنية التي تكمن في قلب نماذج توليد الصور والموسيقى. مستوحاة من الفيزياء، حيث تقوم هذه الأنظمة «بتدمير» بنية البيانات (مثل صورة) عن طريق إضافة ضجيج عشوائي حتى لا يتبقى شيء، ثم تتعلم عملية «الانتشار العكسي» لاستعادة البيانات الأصلية من هذا الضجيج، مما يمنحها القدرة على ابتكار محتوى جديد.

التقطير (Distillation)

تقنية تستخدم لاستخراج المعرفة من نموذج ذكاء اصطناعي ضخم (المعلم) ونقلها إلى نموذج أصغر (الطالب). يساعد ذلك في إنشاء نماذج أصغر حجماً وأكثر كفاءة وسرعة، مع الحفاظ على مستوى أداء قريب من النموذج الأصلي. يُعتقد أن OpenAI استخدمت هذه الطريقة لتطوير نموذج GPT-4 Turbo.

الضبط الدقيق (Fine-tuning)

عملية تدريب إضافية لنموذج ذكاء اصطناعي مُدرب مسبقاً لتحسين أدائه في مهمة محددة أو قطاع معين. تعتمد العديد من الشركات الناشئة على هذه التقنية لتحويل النماذج العامة إلى أدوات متخصصة في مجالات مثل الطب أو القانون عبر تغذيتها ببيانات قطاعية دقيقة.

الشبكات التنافسية التوليدية (GANs)

إطار عمل يتكون من شبكتين عصبيتين تتنافسان فيما بينهما: الأولى (المولد) تحاول إنشاء بيانات واقعية، والثانية (المميز) تحاول كشف إذا ما كانت البيانات مصطنعة. هذا التنافس يدفع النظام لإنتاج مخرجات شديدة الواقعية، وهي التقنية الأساسية خلف أدوات «التزييف العميق» (Deepfakes).

الهلوسة (Hallucination)

هو المصطلح المفضل في الصناعة لوصف قيام النماذج باختلاق معلومات غير صحيحة وتقديمها بثقة. تنشأ الهلوسة عادةً بسبب فجوات في بيانات التدريب، وهي تمثل تحدياً كبيراً لجودة المخرجات وموثوقيتها، مما يدفع الشركات للتحول نحو النماذج المتخصصة لتقليل مخاطر المعلومات المضللة.

الاستدلال (Inference)

هي عملية تشغيل نموذج الذكاء الاصطناعي فعلياً لتقديم تنبؤات أو استنتاجات بناءً على البيانات التي تدرب عليها. لا يمكن حدوث الاستدلال دون تدريب مسبق، وتعتمد جودته وسرعته على قوة العتاد المستخدم، من الهواتف الذكية إلى الخوادم السحابية العملاقة.

النماذج اللغوية الكبيرة (LLMs)

النماذج التي تشغل المساعدين الأذكياء مثل ChatGPT وClaude وGemini. تتكون هذه النماذج من مليارات المعاملات الرقمية (Parameters) التي تتعلم العلاقات بين الكلمات والعبارات، مما يسمح لها بتوليد نصوص تبدو وكأنها مكتوبة من قبل بشر عبر التنبؤ بالكلمة التالية الأكثر احتمالاً.

ذاكرة التخزين المؤقت (Memory Cache)

تقنية تحسين تهدف لجعل عملية الاستدلال أكثر كفاءة وسرعة. من خلال حفظ بعض الحسابات الرياضية المعقدة لاستخدامها في الاستفسارات المستقبلية، تقلل الذاكرة المؤقتة (مثل KV caching) من الجهد الخوارزمي والوقت اللازم لإنتاج الإجابات.

الشبكة العصبية (Neural Network)

بنية خوارزمية متعددة الطبقات تحاكي طريقة عمل الدماغ البشري. بفضل التطور في وحدات معالجة الرسومات (GPUs)، تمكنت هذه الشبكات من تحقيق قفزات هائلة في مجالات التعرف على الصوت، والملاحة الذاتية، واكتشاف الأدوية.

أزمة الرامات (RAMageddon)

مصطلح يصف النقص المتزايد في رقائق ذاكرة الوصول العشوائي (RAM) نتيجة الطلب الهائل من شركات الذكاء الاصطناعي لتشغيل مراكز البيانات. هذا النقص أدى لارتفاع الأسعار وأثر على صناعات أخرى مثل الألعاب والإلكترونيات الاستهلاكية.

التدريب (Training)

العملية الأساسية لتطوير الذكاء الاصطناعي، حيث يتم تغذية النموذج بالبيانات ليتعلم الأنماط. التدريب هو المرحلة التي يتشكل فيها النموذج ويصبح قادراً على أداء المهام، وهي عملية مكلفة تتطلب قدرات حوسبية وطاقة هائلة.

الرموز (Tokens)

هي الوحدات الأساسية للتواصل بين الإنسان والذكاء الاصطناعي. يتم تقسيم البيانات الخام (النصوص) إلى «رموز» تفهمها النماذج اللغوية. كما تُستخدم الرموز كوحدة قياس للتكلفة؛ حيث تفرض معظم شركات الذكاء الاصطناعي رسومها بناءً على عدد الرموز المستهلكة في كل طلب.

تعلم النقل (Transfer Learning)

تقنية يتم فيها استخدام نموذج تم تدريبه مسبقاً كنقطة انطلاق لمهمة جديدة ذات صلة. يساعد ذلك في توفير الوقت والتكاليف، خاصة عندما تكون البيانات المتاحة للمهمة الجديدة محدودة.

الأوزان (Weights)

هي قيم عددية تحدد مدى الأهمية المعطاة لميزات معينة في البيانات أثناء التدريب. من خلال ضبط هذه الأوزان، يتعلم النموذج ما هو مهم للوصول إلى النتيجة الصحيحة، مثل تحديد العوامل الأكثر تأثيراً في توقع أسعار العقارات.

المصدر: TechCrunch