رؤى المستقبل

إطلاق GPT-5: محرك OpenAI الجديد لقوة الترميز ومهام الوكيل

AI
رؤى الذكاء والمستقبل
· · 3 دقائق قراءة
إطلاق GPT-5: محرك OpenAI الجديد لقوة الترميز ومهام الوكيل

أطلقت OpenAI رسميًا GPT-5 عبر منصة API الخاصة بها، مما يمثل قفزة كبيرة إلى الأمام في قدرات الذكاء الاصطناعي، خاصة لمهام الترميز ومهام الوكيل. يتميز هذا النموذج الجديد بأداء حديث عبر معايير الترميز الرئيسية، متجاوزًا سابقيه في الكفاءة والدقة على حد سواء. تم تصميم GPT-5 ليكون متعاونًا حقيقيًا في الترميز، ويتفوق في إنشاء التعليمات البرمجية وإصلاح الأخطاء وتحرير التعليمات البرمجية وفهم قواعد التعليمات البرمجية المعقدة. بالإضافة إلى الترميز، يظهر GPT-5 أداءً استثنائيًا في مهام الوكيل طويلة الأمد، مما يدل على تحسين ذكاء الأدوات والقدرة على ربط العديد من استدعاءات الأدوات بشكل موثوق. تتعمق مشاركة المدونة هذه في الميزات والتحسينات ومعايير الأداء الرئيسية لـ GPT-5، مما يوفر للمطورين نظرة عامة شاملة على هذه الأداة الجديدة القوية.

براعة ترميز لا مثيل لها

  • أداء SOTA: يحقق GPT-5 درجة 74.9٪ في SWE-bench Verified و 88٪ في Aider polyglot، متجاوزًا بشكل كبير النماذج السابقة مثل o3.
  • الكفاءة: يحقق هذه الدرجات العالية مع عدد أقل بنسبة 22٪ من الرموز المميزة للإخراج وعدد أقل بنسبة 45٪ من استدعاءات الأدوات مقارنة بـ o3 بجهد استدلالي عالٍ.
  • التميز في الواجهة الأمامية: تكشف الاختبارات الداخلية أن GPT-5 يتفوق على o3 في تطوير الويب للواجهة الأمامية بنسبة 70٪ من الوقت.
  • الاختبار في العالم الحقيقي: يشيد المختبرون الأوائل من شركات مثل Cursor و Windsurf و Vercel بذكائه وقابليته للتوجيه وأدائه في مهام الترميز في العالم الحقيقي.

إتقان مهام الوكيل

  • مهام طويلة الأمد: يحقق GPT-5 نتائج SOTA في τ2-bench telecom (96.7٪)، وهو معيار صعب لاستدعاء الأدوات.
  • ذكاء الأدوات: يسمح ذكاء الأدوات المحسن لـ GPT-5 بربط العشرات من استدعاءات الأدوات بشكل موثوق، حتى بالتوازي.
  • معالجة الأخطاء: يتفوق في اتباع تعليمات الأداة ومعالجة أخطاء الأداة واسترجاع المحتوى طويل السياق.
  • التحقق من صحة الصناعة: تسلط شركات مثل Manus و Notion و Inditex الضوء على أدائه واستجابته السريعة وعمق منطقه.

ميزات API جديدة لتحسين التحكم

  • معامل الإسهاب: يمكن للمطورين الآن التحكم في طول وشمولية استجابات النموذج باستخدام المعامل الجديد verbosity (منخفض، متوسط، عالي).
  • معامل جهد الاستدلال: تسمح القيمة minimal لمعامل reasoning_effort بإجابات أسرع مع استدلال أقل شمولاً.
  • أدوات مخصصة: يتيح نوع أداة جديد، custom tools، لـ GPT-5 استدعاء الأدوات بنص عادي بدلاً من JSON، مما يبسط عمليات تكامل الأدوات المعقدة.

أحجام النموذج والتوافر

  • ثلاثة أحجام: يتوفر GPT-5 بثلاثة أحجام في API: gpt-5 و gpt-5-mini و gpt-5-nano، مما يوفر مرونة في الموازنة بين الأداء والتكلفة وزمن الوصول.
  • تكامل ChatGPT: بينما يستخدم GPT-5 في ChatGPT نظامًا من نماذج الاستدلال وعدم الاستدلال والتوجيه، يركز إصدار API على نموذج الاستدلال لتحقيق أقصى أداء.
  • نموذج غير استدلالي: يتوفر النموذج غير الاستدلالي المستخدم في ChatGPT باسم gpt-5-chat-latest في API.

تحسين السلامة والدقة

  • تقليل الهلوسة: يرتكب GPT-5 أخطاء واقعية أقل بنسبة 80٪ تقريبًا من o3 في مطالبات من معايير LongFact و FactScore.
  • الوعي الذاتي: تم تدريب النموذج ليكون أكثر وعيًا ذاتيًا بحدوده وقادرًا بشكل أفضل على التعامل مع المواقف غير المتوقعة.
  • دقة أسئلة الصحة: يُظهر GPT-5 دقة محسّنة في الأسئلة المتعلقة بالصحة.

التسعير والوصول

  • توافر API: يتوفر GPT-5 و GPT-5-mini و GPT-5-nano الآن في منصة API، لدعم API الاستجابات و API إكمال الدردشة و Codex CLI.
  • هيكل التسعير: يختلف التسعير حسب حجم النموذج، حيث يتم تسعير GPT-5 بـ 1.25 دولارًا / 1 مليون رمز مميز للإدخال و 10 دولارات / 1 مليون رمز مميز للإخراج.
  • تكامل Microsoft: يتم إطلاق GPT-5 أيضًا عبر منصات Microsoft، بما في ذلك Microsoft 365 Copilot و Copilot و GitHub Copilot و Azure AI Foundry.

في الختام، يمثل GPT-5 تطورًا كبيرًا في قدرات الذكاء الاصطناعي، حيث يقدم للمطورين أداة قوية لمهام الترميز والوكيل. إن أدائه المتفوق وميزات التحكم المحسّنة والسلامة المحسّنة تجعله رصيدًا قيمًا لبناء تطبيقات مبتكرة. يضمن توفر أحجام نماذج مختلفة ودعم شامل لل API أن يتمكن المطورون من تكييف GPT-5 مع احتياجاتهم ومتطلباتهم الخاصة. مع دمج GPT-5 في منصات مختلفة، فإنه مهيأ لإحداث ثورة في الطريقة التي يتعامل بها المطورون مع الترميز وأتمتة المهام.


المصدر: OpenAI

مقالات ذات صلة

التعليقات

البريد لن يُنشر - يُستخدم للصورة الرمزية فقط

جاري تحميل التعليقات...