رؤى المستقبل

أوبن إيه آي تطلق نماذج لغوية مفتوحة المصدر رائدة: gpt-oss-120b و gpt-oss-20b

AI
رؤى الذكاء والمستقبل
· · 3 دقائق قراءة
أوبن إيه آي تطلق نماذج لغوية مفتوحة المصدر رائدة: gpt-oss-120b و gpt-oss-20b

أعلنت أوبن إيه آي عن إطلاق نموذجين لغويين جديدين مفتوحي المصدر، وهما gpt-oss-120b و gpt-oss-20b، مما يمثل خطوة كبيرة في إتاحة وتطوير تكنولوجيا الذكاء الاصطناعي. تهدف هذه النماذج إلى تقديم أداء قوي بتكلفة أقل، مما يتيح اعتمادًا وتخصيصًا أوسع عبر مختلف التطبيقات. متوفرة بموجب ترخيص Apache 2.0، فإنها تتفوق على النماذج المفتوحة المماثلة في الحجم في مهام الاستدلال، وتظهر قدرات قوية في استخدام الأدوات، وهي مُحسّنة للنشر الفعال على أجهزة المستهلكين.

الميزات والقدرات الرئيسية

  • أداء عالٍ: يتطابق gpt-oss-120b تقريبًا مع نموذج o4-mini الخاص بـ OpenAI في معايير الاستدلال، بينما يعكس gpt-oss-20b الأصغر أداء o3-mini.
  • كفاءة الموارد: يمكن لـ gpt-oss-120b العمل على وحدة معالجة رسوميات واحدة (GPU) بسعة 80 جيجابايت، وتم تصميم gpt-oss-20b للأجهزة الطرفية بسعة 16 جيجابايت فقط من الذاكرة.
  • استخدام الأدوات والاستدلال: يتفوق كلا النموذجين في استخدام الأدوات، واستدعاء الوظائف القليل الطلقات، والاستدلال بسلسلة الأفكار (CoT)، كما يتضح من أدائهما في معايير مثل Tau-Bench و HealthBench.
  • التخصيص والتحكم: تدعم النماذج سلسلة الأفكار الكاملة (CoT)، والمخرجات المهيكلة، وهي قابلة للتخصيص بالكامل، مما يمنح المطورين تحكمًا دقيقًا في سلوكها.
  • التوافق: تم تصميم هذه النماذج للعمل بسلاسة مع واجهة برمجة تطبيقات الردود (Responses API) وضمن مهام سير العمل الآلية.

الهندسة المعمارية والتدريب

  • خليط الخبراء (MoE): يستخدم كلا النموذجين بنية Transformer تستفيد من MoE لتقليل عدد المعلمات النشطة لكل رمز (5.1 مليار لـ gpt-oss-120b و 3.6 مليار لـ gpt-oss-20b).
  • أنماط الانتباه: تستخدم النماذج أنماط انتباه متناوبة كثيفة ومتباعدة محليًا، مستوحاة من GPT-3.
  • انتباه متعدد الاستعلامات المجمعة: لتحسين الاستدلال وكفاءة الذاكرة، يتم استخدام انتباه متعدد الاستعلامات المجمعة بحجم مجموعة 8.
  • تضمين الموضع الدوراني (RoPE): يتم استخدام RoPE لتضمين الموضع، مما يدعم أطوال السياق التي تصل إلى 128 ألف.
  • بيانات التدريب: تم تدريب النماذج على مجموعة بيانات نصية باللغة الإنجليزية في الغالب، مع التركيز على العلوم والتكنولوجيا والهندسة والرياضيات (STEM) والبرمجة والمعرفة العامة، وتم ترميزها باستخدام مجموعة فرعية من أداة الترميز المستخدمة في o4-mini و GPT-4o.

ما بعد التدريب والمواءمة

  • الضبط الدقيق الخاضع للإشراف والتعلم المعزز: تم استخدام عملية ما بعد التدريب مماثلة لتلك المستخدمة في o4-mini، بما في ذلك الضبط الدقيق الخاضع للإشراف والتعلم المعزز لمواءمة النماذج مع مواصفات نموذج OpenAI.
  • جهود الاستدلال: تدعم النماذج ثلاثة جهود استدلال (منخفضة ومتوسطة وعالية) لتحقيق التوازن بين زمن الوصول والأداء.

تدابير السلامة

  • تدريب شامل على السلامة: خضعت النماذج لتدريب وتقييمات واسعة النطاق للسلامة.
  • تقييم الضبط الدقيق المعادي: تم اختبار نسخة مضبوطة بدقة معادية من gpt-oss-120b بموجب إطار الاستعداد الخاص بـ OpenAI.
  • معايير السلامة الداخلية: تقدم نماذج gpt-oss أداءً مشابهًا لنماذج OpenAI الرائدة في معايير السلامة الداخلية.
  • تحدي الفريق الأحمر: يتم استضافة تحدي الفريق الأحمر بقيمة 500,000 دولار لتحديد مشكلات السلامة الجديدة، مع نشر تقرير ومجموعة بيانات تقييم مفتوحة المصدر.

التوفر والتكامل

  • Hugging Face: تتوفر أوزان النموذج للتنزيل مجانًا على Hugging Face بتنسيق MXFP4.
  • تحسين الأجهزة: مُحسّنة لأجهزة NVIDIA و AMD و Cerebras و Groq.
  • منصات النشر: يشمل الشركاء Azure و Hugging Face و vLLM و Ollama و llama.cpp و LM Studio و AWS و Fireworks و Together AI و Baseten و Databricks و Vercel و Cloudflare و OpenRouter.
  • تكامل Microsoft: تتوفر إصدارات مُحسّنة لوحدة معالجة الرسوميات (GPU) من gpt-oss-20b على أجهزة Windows عبر ONNX Runtime و Foundry Local و AI Toolkit for VS Code.

تأمل OpenAI أن يمكّن إطلاق gpt-oss-120b و gpt-oss-20b المطورين والباحثين والمؤسسات في جميع أنحاء العالم من بناء وتخصيص حلول الذكاء الاصطناعي على بنيتهم التحتية الخاصة بهم، مما يعزز الابتكار ويضفي طابعًا ديمقراطيًا على الوصول إلى تكنولوجيا الذكاء الاصطناعي المتقدمة. هذه النماذج المفتوحة مهيأة لتسريع الأبحاث المتطورة وتعزيز الابتكار وتمكين تطوير الذكاء الاصطناعي الأكثر أمانًا وشفافية عبر مجموعة واسعة من حالات الاستخدام.


المصدر: N/A

مقالات ذات صلة

التعليقات

البريد لن يُنشر - يُستخدم للصورة الرمزية فقط

جاري تحميل التعليقات...