رؤى المستقبل

أبحاث مايكروسوفت تٌحرز تقدماً في التكميم منخفض البت للنماذج اللغوية الكبيرة على الأجهزة الطرفية

AI
رؤى الذكاء والمستقبل
· · 3 دقائق قراءة
أبحاث مايكروسوفت تٌحرز تقدماً في التكميم منخفض البت للنماذج اللغوية الكبيرة على الأجهزة الطرفية

تعمل نماذج اللغة الكبيرة (LLMs) على تغيير التطبيقات المختلفة بسرعة، لكن متطلباتها الحسابية الكبيرة تمثل تحديًا لنشرها على الأجهزة الطرفية ذات الموارد المحدودة مثل الهواتف الذكية والروبوتات. تسلط هذه المدونة من أبحاث Microsoft الضوء على التطورات في تقنيات التكميم منخفضة البت التي تعالج هذه المشكلة، مما يتيح التشغيل الفعال لـ LLM على الأجهزة الطرفية. يقدم الباحثون مناهج مبتكرة لضرب المصفوفات الدقيقة المختلطة (mpGEMM) وهياكل الأجهزة، مما يمهد الطريق لعصر جديد من إمكانية الوصول إلى الذكاء الاصطناعي.

تحدي نماذج اللغة الكبيرة على الأجهزة الطرفية

يكمن العائق الرئيسي في نشر نماذج اللغة الكبيرة على الأجهزة الطرفية في حجمها الهائل وما ينتج عن ذلك من طلب على ذاكرة كبيرة وقدرة حسابية. يوفر التكميم منخفض البت حلاً عن طريق ضغط النماذج وتقليل مساحة الذاكرة، لكن قيود الأجهزة التقليدية تعيق التحقيق الكامل في حسابات الدقة المختلطة.

  • تتطلب نماذج اللغة الكبيرة مئات الملايين من المعلمات، مما يؤدي إلى ارتفاع الطلب على الذاكرة والحساب.
  • تفتقر الأجهزة الطرفية غالبًا إلى الموارد اللازمة لتشغيل هذه النماذج بكفاءة.
  • تدعم معظم الأجهزة الحسابات المتماثلة فقط، مما يعيق استخدام mpGEMM.

Ladder: سد فجوة أنواع البيانات

Ladder هو مترجم لأنواع البيانات مصمم لسد الفجوة بين تنسيقات البيانات المخصصة وقيود الأجهزة. من خلال تمكين فصل تخزين البيانات عن الحساب، يسمح Ladder بدعم أوسع لأنواع البيانات المخصصة دون الحاجة إلى تعديلات في الأجهزة.

  • يقوم Ladder بتحويل أنواع البيانات غير المدعومة إلى أنواع متوافقة مع الأجهزة دون فقدان البيانات.
  • إنه يحسن الأداء عن طريق ترجمة البيانات منخفضة البت إلى أكثر التنسيقات كفاءة للأجهزة المستهدفة.
  • تظهر التقييمات على وحدات معالجة الرسوميات NVIDIA وAMD تسريعًا يصل إلى 14.6 مرة مقارنة بمترجمات DNN الحالية.

T-MAC: mpGEMM خالٍ من الضرب

T-MAC (بحث جدول لـ mpGEMM) هو نهج جديد يلغي الحاجة إلى إلغاء التكميم والضرب، مما يتيح mpGEMM فعالاً على الأجهزة الطرفية ذات الموارد المحدودة. إنه يستبدل عمليات الضرب التقليدية بعمليات بحث جدولية على مستوى البت، مما يقلل من الحمل الحسابي.

  • يستبدل T-MAC الضرب بعمليات بحث جدولية على مستوى البت، مما يقلل من الطلب الحسابي.
  • إنه يحقق مكاسب كبيرة في الأداء على الأجهزة الطرفية مثل Surface Laptop 7 و Raspberry Pi 5.
  • أظهر الاختبار 48 رمزًا في الثانية لنموذج 3B BitNet-b1.58 على Surface Laptop 7.

LUT Tensor Core: أجهزة لـ mpGEMM فعال

LUT Tensor Core هو تصميم مشترك للبرامج والأجهزة مصمم خصيصًا لاستنتاج LLM منخفض البت. يعالج الحمل المرتبط بطرق LUT التقليدية ويدعم مستويات دقة مختلفة في mpGEMM. هذا يسمح بسرعة وكفاءة أكبر في تطبيقات الأجهزة الطرفية.

  • إنه يحسن حساب الجدول المسبق والتخزين من خلال تقنيات مثل تحويل DFG القائم على البرامج ودمج المشغل.
  • يتميز تصميم الأجهزة بشكل تجانب مطول لتعزيز إعادة استخدام الجدول وتصميم تسلسلي للبت لمجموعات دقة مختلفة.
  • تُظهر الاختبارات أن LUT Tensor Core يحقق 6.93 ضعف سرعة الاستدلال باستخدام 38.3٪ فقط من مساحة Tensor Core التقليدي.

مستقبل الذكاء الاصطناعي المجسد

إن التطورات في التكميم منخفض البت لا تحسن الكفاءة فحسب، بل تتيح أيضًا توسيع نطاق النموذج، مما يعزز قدرات النموذج والتعبير. تمهد هذه التقنيات الطريق لأنظمة الذكاء الاصطناعي المجسدة، مثل الروبوتات، القادرة على الإدراك الديناميكي والتفاعل البيئي في الوقت الفعلي.

  • يقلل التكميم منخفض البت من الطلب على الذاكرة والحساب، مما يجعل نماذج اللغة الكبيرة أكثر سهولة.
  • تدعم تقنيات مثل T-MAC و Ladder و LUT Tensor Core التشغيل الفعال على الأجهزة الطرفية.
  • يمكن لأنظمة الذكاء الاصطناعي المجسدة الاستفادة من هذه التطورات للإدراك الديناميكي والتفاعل في الوقت الفعلي.

في الختام، تمثل ابتكارات أبحاث Microsoft في التكميم منخفض البت خطوة مهمة نحو تمكين نماذج اللغة الكبيرة على الأجهزة الطرفية. من خلال التغلب على قيود الأجهزة وتطوير طرق حساب فعالة، تفتح هذه التطورات إمكانيات جديدة لتطبيقات الذكاء الاصطناعي عبر مجموعة واسعة من السيناريوهات، من الهواتف الذكية إلى الروبوتات. إن توافر T-MAC و Ladder مفتوح المصدر يشجع أيضًا على الاستكشاف والابتكار في هذا المجال سريع التطور.


المصدر: Microsoft Research

مقالات ذات صلة

التعليقات

البريد لن يُنشر - يُستخدم للصورة الرمزية فقط

جاري تحميل التعليقات...