رؤى المستقبل

تقديم EmbeddingGemma: أفضل نموذج مفتوح المصدر لفئة تضمين الذكاء الاصطناعي على الجهاز

AI
رؤى الذكاء والمستقبل
· · 3 دقائق قراءة
تقديم EmbeddingGemma: أفضل نموذج مفتوح المصدر لفئة تضمين الذكاء الاصطناعي على الجهاز

أعلنت جوجل عن EmbeddingGemma، وهو نموذج تضمين مفتوح المصدر جديد مصمم لتطبيقات الذكاء الاصطناعي على الجهاز. يهدف هذا النموذج إلى توفير عمليات تضمين عالية الجودة وخاصة مباشرة على الأجهزة، حتى بدون اتصال بالإنترنت، مما يتيح قدرات مثل خطوط RAG غير المتصلة بالإنترنت والبحث الدلالي.

الميزات والفوائد الرئيسية لـ EmbeddingGemma

  • أفضل أداء في فئته: تحتل EmbeddingGemma المرتبة الأولى بين نماذج تضمين النصوص متعددة اللغات المفتوحة المصدر التي تقل عن 500 مليون معلمة في معيار Massive Text Embedding Benchmark (MTEB).
  • حجم صغير وكفاءة: يتميز النموذج بتصميم معلمة 308 مليون، مما يسمح بتشغيله على أقل من 200 ميجابايت من ذاكرة الوصول العشوائي (RAM) مع تحديد الكميات، مما يجعله مناسبًا للهواتف المحمولة وأجهزة الكمبيوتر المحمولة وأجهزة الكمبيوتر المكتبية.
  • وظائف غير متصلة بالإنترنت: تم تصميم EmbeddingGemma للاستخدام دون اتصال بالإنترنت، ويوفر أبعاد إخراج قابلة للتخصيص (من 768 إلى 128 عبر تمثيل Matryoshka) ونافذة سياق رمزية 2K.
  • التكامل مع الأدوات الشائعة: يتكامل EmbeddingGemma بسلاسة مع الأدوات الشائعة مثل sentence-transformers و llama.cpp و MLX و Ollama و LiteRT و transformers.js و LMStudio و Weaviate و Cloudflare و LlamaIndex و LangChain.

تمكين خطوط RAG الأولى للجوال

يتفوق EmbeddingGemma في إنشاء عمليات التضمين، وهي تمثيلات رقمية للنص تستخدم لالتقاط المعنى في فضاء عالي الأبعاد. هذه التضمينات ضرورية لخطوط Retrieval Augmented Generation (RAG).

  • دقة استرجاع محسنة: تؤدي عمليات التضمين عالية الجودة في EmbeddingGemma إلى استرجاع أكثر دقة للسياق ذي الصلة استنادًا إلى إدخال المستخدم، مما يعزز الأداء العام لخط RAG.
  • إجابات ذات صلة سياقيًا: من خلال إقران EmbeddingGemma بنموذج توليدي مثل Gemma 3، يمكن للمطورين إنشاء تطبيقات تولد إجابات ذات صلة سياقيًا تستند إلى المعرفة المسترجعة.

تفاصيل الأداء والكفاءة

  • جودة على أحدث طراز: يقدم EmbeddingGemma فهمًا للنصوص على أحدث طراز لحجمه، مما يدل على أداء قوي في إنشاء التضمين متعدد اللغات.
  • Matryoshka Representation Learning (MRL): توفر هذه التقنية أحجام تضمين متعددة من نموذج واحد، مما يسمح للمطورين بالاختيار بين الحد الأقصى للجودة (768 بُعدًا) وزيادة السرعة / تقليل تكاليف التخزين (128 أو 256 أو 512 بُعدًا).
  • تحسين السرعة: يحقق EmbeddingGemma <15 مللي ثانية لوقت استنتاج التضمين (256 رمز إدخال) على EdgeTPU.
  • Quantization-Aware Training (QAT): يقلل QAT بشكل كبير من استخدام ذاكرة الوصول العشوائي (RAM) إلى أقل من 200 ميجابايت مع الحفاظ على جودة النموذج.

حالات الاستخدام والتطبيقات

يمكّن EmbeddingGemma مجموعة واسعة من تطبيقات الذكاء الاصطناعي على الجهاز:

  • البحث دون اتصال بالإنترنت: ابحث في الملفات الشخصية والنصوص ورسائل البريد الإلكتروني والإشعارات دون اتصال بالإنترنت.
  • روبوتات الدردشة المخصصة: قم بإنشاء روبوتات دردشة مخصصة خاصة بالصناعة وممكنة دون اتصال بالإنترنت من خلال RAG مع Gemma 3n.
  • فهم الوكيل المتنقل: قم بتصنيف استعلامات المستخدم إلى استدعاءات وظيفية ذات صلة لتحسين فهم الوكيل المتنقل.
  • الضبط الدقيق: يمكن ضبط النموذج بدقة لمجالات أو مهام أو لغات معينة باستخدام دفتر الملاحظات السريع المقدم.

اختيار نموذج التضمين المناسب

تقدم جوجل نماذج تضمين مختلفة اعتمادًا على التطبيق:

  • EmbeddingGemma: الأفضل لحالات الاستخدام على الجهاز وغير المتصلة بالإنترنت حيث تكون الخصوصية والسرعة والكفاءة ذات أهمية قصوى.
  • نموذج Gemini Embedding (عبر Gemini API): موصى به للتطبيقات واسعة النطاق من جانب الخادم التي تتطلب أعلى جودة وأقصى أداء.

البدء مع EmbeddingGemma

جعلت جوجل EmbeddingGemma في متناول الجميع:

  • تنزيلات النموذج: ابحث عن أوزان النموذج على Hugging Face و Kaggle و Vertex AI.
  • الوثائق والأدلة: قم بالوصول إلى الوثائق للتكامل السريع وأدلة الاستنتاج / الضبط الدقيق. استكشف مثال RAG السريع في Gemma Cookbook.
  • تكامل الأدوات: استخدم EmbeddingGemma مع أدوات مثل transformers.js و MLX و llama.cpp و LiteRT و Ollama و LMStudio و Weaviate.

في الختام، يمثل EmbeddingGemma تقدمًا كبيرًا في الذكاء الاصطناعي على الجهاز، مما يوفر للمطورين حلاً قويًا وفعالًا وخاصًا لبناء مجموعة واسعة من التطبيقات. إن أداءه الأفضل في فئته وحجمه الصغير وقدراته غير المتصلة بالإنترنت تجعله خيارًا مقنعًا لخطوط RAG الأولى للجوال والمهام الأخرى التي تعتمد على التضمين.


المصدر: Google for Developers

مقالات ذات صلة

التعليقات

البريد لن يُنشر - يُستخدم للصورة الرمزية فقط

جاري تحميل التعليقات...