رؤى المستقبل

وحدة المعالجة العصبية MediaTek و LiteRT: إطلاق العنان لقوة الذكاء الاصطناعي على الجهاز

AI
رؤى الذكاء والمستقبل
· · 3 دقائق قراءة
وحدة المعالجة العصبية MediaTek و LiteRT: إطلاق العنان لقوة الذكاء الاصطناعي على الجهاز

لقد أحدث صعود وحدات المعالجة العصبية (NPUs) ثورة في الذكاء الاصطناعي على الجهاز، مما مكن نماذج الذكاء الاصطناعي التوليدية المتطورة على الأجهزة الطرفية. ومع ذلك، كان نشر الذكاء الاصطناعي على وحدات المعالجة العصبية المتنوعة يمثل تحديًا. تقدم Google، بالتعاون مع MediaTek، مسرّع LiteRT NeuroPilot لتبسيط نشر NPU وإطلاق العنان لقدرات الذكاء الاصطناعي المتقدمة على ملايين الأجهزة. يلخص هذا المقال الميزات والفوائد الرئيسية لهذا المسرع الجديد.

سير عمل مبسط وموحد للنشر

يوفر مسرّع LiteRT NeuroPilot سير عمل مبسطًا لنشر نماذج الذكاء الاصطناعي على وحدات المعالجة العصبية MediaTek، مما يزيل تعقيد حزم SDK الفردية. تتيح واجهة برمجة التطبيقات الموحدة هذه للمطورين استهداف وحدات المعالجة العصبية MediaTek المختلفة بسهولة.

  • الترجمة البرمجية غير المتصلة بالإنترنت (Ahead-of-Time - AOT): مثالية للنماذج الكبيرة والمعقدة حيث تكون SoC الهدف معروفة. تقلل ترجمة AOT من تكاليف التهيئة وتقلل من استخدام الذاكرة.
  • الترجمة البرمجية عبر الإنترنت (على الجهاز): مناسبة لتوزيع النماذج المستقلة عن النظام الأساسي للنماذج الأصغر. يتم تجميع النموذج على جهاز المستخدم أثناء التهيئة.
  • عملية النشر المكونة من 3 خطوات: عملية مبسطة تتضمن ترجمة AOT (اختيارية)، والنشر مع Google Play للذكاء الاصطناعي على الجهاز (PODAI)، والاستدلال باستخدام LiteRT Runtime.
  • آلية الاحتياط: إذا كانت NPU غير متوفرة، فإن LiteRT تتحول تلقائيًا إلى GPU أو CPU، مما يضمن وظائف التطبيق.

قدرات الذكاء الاصطناعي التوليدية الغنية

يطلق التعاون بين Google و MediaTek الإمكانات الكاملة لنماذج الأوزان المفتوحة الحديثة، بما في ذلك عائلة Gemma من Google، مما يتيح ميزات الذكاء الاصطناعي التوليدية المتقدمة على وحدات المعالجة العصبية.

  • دعم نماذج Gemma: دعم مُحسَّن لنماذج مثل Gemma 3 270M و Gemma 3 1B و Gemma 3n E2B و EmbeddingGemma 300M.
  • زيادة الأداء: يتم تسريع نماذج Gemma بما يصل إلى 12x مقارنة بوحدة المعالجة المركزية و 10x مقارنة بوحدة معالجة الرسومات على وحدات المعالجة العصبية MediaTek.
  • LiteRT-LM: واجهة برمجة تطبيقات عالية المستوى مبنية على LiteRT، مصممة لسهولة الاستدلال بنماذج توليد النصوص.
  • تكامل EmbeddingGemma: يتناسب تمامًا مع واجهة برمجة تطبيقات “tensor-in, tensor-out” الخاصة بـ LiteRT لمهام مثل Retrieval Augmented Generation (RAG) والبحث الدلالي.

تطوير فعال عبر الأنظمة الأساسية

يعمل LiteRT NeuroPilot Accelerator على تبسيط التطوير باستخدام واجهة برمجة تطبيقات C++ جديدة وقابلية التشغيل البيني لذاكرة التخزين المؤقت للأجهزة الأصلية.

  • واجهة برمجة تطبيقات C++ مبسطة: تحسين على واجهة برمجة تطبيقات C السابقة، مما يسهل بناء خطوط أنابيب ML فعالة.
  • قابلية التشغيل البيني لذاكرة التخزين المؤقت للأجهزة الأصلية: يسمح بتمرير البيانات بدون نسخ من AHardwareBuffer مباشرة إلى NPU.
  • قابلية التشغيل البيني بدون نسخ: يتيح التكامل السلس بين مخازن OpenGL/OpenCL و AHardwareBuffer، وهو أمر بالغ الأهمية لتطبيقات الكاميرا والفيديو في الوقت الفعلي.
  • تقليل تحويل البيانات: بدلاً من تحويل البيانات من وإلى وحدة المعالجة المركزية، يمكن تمرير إطارات الكاميرا أو الفيديو مباشرة من مكونات خط أنابيب ML الأخرى إلى NPU عبر LiteRT.

خاتمة

يقدم LiteRT NeuroPilot Accelerator تقدمًا كبيرًا في نشر الذكاء الاصطناعي على الجهاز، مما يبسط العملية ويطلق العنان للإمكانات الكاملة لوحدات المعالجة العصبية MediaTek. بفضل سير العمل الموحد، وقدرات الذكاء الاصطناعي التوليدية الغنية، وأدوات التطوير الفعالة عبر الأنظمة الأساسية، يمكّن LiteRT المطورين من إنشاء تطبيقات ذكاء اصطناعي مبتكرة وعالية الأداء تفيد ملايين المستخدمين حول العالم. يتم تشجيع المطورين على استكشاف LiteRT example Colab وتطبيق العينة وموقع Devsite الرسمي للحصول على مزيد من الوثائق والإرشادات.


المصدر: Google

مقالات ذات صلة

التعليقات

البريد لن يُنشر - يُستخدم للصورة الرمزية فقط

جاري تحميل التعليقات...