رؤى المستقبل

كي بي لام: إنجاز مايكروسوفت في نماذج اللغة الكبيرة القابلة للتطوير والمدمجة بالمعرفة

AI
رؤى الذكاء والمستقبل
· · 3 دقائق قراءة
كي بي لام: إنجاز مايكروسوفت في نماذج اللغة الكبيرة القابلة للتطوير والمدمجة بالمعرفة

تعتبر نماذج اللغة الكبيرة (LLMs) قوية، ولكنها تعاني من صعوبة في دمج المعرفة الخارجية بكفاءة. قدمت Microsoft Research نموذج KBLaM (نموذج اللغة المعزز بقاعدة المعرفة)، وهو نهج جديد يدمج قواعد المعرفة المنظمة مباشرة في نماذج اللغة الكبيرة المدربة مسبقًا، مما يوفر بديلاً قابلاً للتطوير وفعالًا وقابلاً للتفسير للطرق التقليدية مثل الضبط الدقيق وإنشاء الاسترجاع المعزز (RAG) والتعلم في السياق. تلخص هذه المقالة الإخبارية الميزات والفوائد الرئيسية لـ KBLaM.

التغلب على قيود طرق دمج المعرفة الحالية

تتضمن الأساليب الحالية لدمج المعرفة الخارجية في نماذج اللغة الكبيرة عيوبًا كبيرة:

  • الضبط الدقيق: يتطلب إعادة تدريب مكلفة للنموذج بأكمله لكل تحديث للمعرفة.
  • إنشاء الاسترجاع المعزز (RAG): يقدم وحدات استرجاع منفصلة، مما يزيد من التعقيد ويمنع التدريب الشامل. يقوم RAG أيضًا بإلحاق أجزاء المستندات المسترجعة بالمطالبات.
  • التعلم في السياق: يعاني من توسيع نطاق حسابي تربيعي، مما يجعله غير فعال لقواعد المعرفة الكبيرة.

تم تصميم KBLaM للتغلب على هذه القيود عن طريق تضمين المعرفة المنظمة مباشرة في بنية النموذج.

KBLaM: نهج جديد لدمج المعرفة

يستخدم KBLaM قاعدة معرفة منظمة، تتكون من ثلاثيات الكيان والخاصية والقيمة، لتوحيد البيانات وتمثيلها. تتكون العملية من خط أنابيب ثلاثي الخطوات:

  • ترميز المعرفة: يتم تحويل كل ثلاثية معرفة إلى زوج متجه قيمة المفتاح باستخدام مشفر جملة مدرب مسبقًا مع محولات خطية خفيفة الوزن.
    • يعمل متجه المفتاح (اسم الكيان والخاصية) كـ “معلومات فهرس”.
    • يلتقط متجه القيمة قيمة الخاصية المقابلة.
  • التكامل مع نماذج اللغة الكبيرة (LLMs): يتم زيادة أزواج قيمة المفتاح في طبقات انتباه النموذج باستخدام بنية انتباه مستطيلة متخصصة.
    • تسمح هذه البنية لرموز اللغة (أسئلة المستخدم) بالاهتمام بجميع رموز المعرفة.
    • لا تهتم رموز المعرفة ببعضها البعض أو برموز اللغة.
    • يقلل هذا من التكلفة الحسابية إلى تعقيد خطي.
  • استرجاع المعرفة الفعال: يتعلم النموذج استرجاع رموز المعرفة ذات الصلة ديناميكيًا أثناء الاستدلال، مما يلغي الحاجة إلى خطوة استرجاع منفصلة.

المزايا الرئيسية لـ KBLaM

يوفر KBLaM العديد من المزايا مقارنة بالطرق الحالية:

  • قابلية التوسع: يحقق توسعًا خطيًا مع حجم قاعدة المعرفة، مما يمكنه من التعامل مع مستودعات معرفة أكبر بكثير من التعلم التقليدي في السياق. يمكن لـ KBLaM معالجة أكثر من 10000 ثلاثية معرفة على وحدة معالجة رسومات واحدة، أي ما يعادل 200000 رمز نصي تقريبًا.
  • الكفاءة: يقلل الانتباه المستطيل بشكل كبير من التكلفة الحسابية مقارنة بنهج التوسع التربيعي. الوقت اللازم للرمز المميز الأول أقل بكثير مما هو عليه مع الأساليب المشابهة لـ RAG.
  • التحديثات الديناميكية: يسمح بإجراء تحديثات ديناميكية لقاعدة المعرفة دون الحاجة إلى إعادة التدريب أو إعادة حساب قاعدة المعرفة بأكملها.
  • القابلية للتفسير: يوفر رؤى حول كيفية استخدام النموذج لرموز المعرفة من خلال أوزان الانتباه، مما يجعل العملية أكثر شفافية من التعلم في السياق.
  • الموثوقية: يعزز موثوقية النموذج من خلال تعلم متى لا يجيب على الأسئلة إذا كانت المعلومات المطلوبة مفقودة، مما يقلل من الهلوسة. يرفض النموذج الإجابة على الأسئلة غير الموجودة في قاعدة معارفه.

مستقبل الذكاء الاصطناعي المعزز بالمعرفة

يمثل KBLaM تقدمًا كبيرًا في الذكاء الاصطناعي المعزز بالمعرفة، مما يمهد الطريق لأنظمة الذكاء الاصطناعي التي يمكن أن توفر استجابات أكثر دقة وقابلية للتكيف ومتكاملة بعمق مع المعرفة. يتمتع هذا النهج بالقدرة على تغيير مجالات مختلفة، بما في ذلك الطب والمالية والبحث العلمي. أصدرت Microsoft Research رمز KBLaM ومجموعات البيانات الخاصة به للمجتمع البحثي، مع خطط للتكامل مع مكتبة Hugging Face transformers.

في حين أن النموذج الحالي مدرب بشكل أساسي على أزواج الأسئلة والأجوبة الواقعية، سيركز البحث المستقبلي على توسيع قدراته عبر مهام استدلال أكثر تعقيدًا ومجالات معرفة متنوعة.


المصدر: Microsoft Research Blog

مقالات ذات صلة

التعليقات

البريد لن يُنشر - يُستخدم للصورة الرمزية فقط

جاري تحميل التعليقات...