أعلنت جوجل ديب مايند للتو عن جيميني 2.5 برو التجريبي، وهو أذكى نموذج للذكاء الاصطناعي حتى الآن، ويمثل تقدمًا كبيرًا في قدرات الذكاء الاصطناعي، لا سيما في الاستدلال والترميز. يعتمد هذا النموذج الجديد على أساس جيميني ويقدم ميزات محسنة مصممة لمعالجة المشكلات المعقدة بشكل أكثر فعالية. يتوفر جيميني 2.5 برو التجريبي الآن للتجربة في استوديو جوجل للذكاء الاصطناعي وجيميني المتقدم، مع توفر أوسع على فيرتكس ايه آي قريبًا. يمثل هذا حقبة جديدة من الذكاء الاصطناعي تركز على فهم أعمق وفهم سياقي.
قدرات الاستدلال المحسنة
تم تصميم جيميني 2.5 برو كـ “نموذج تفكير”، قادر على التفكير في المشكلات قبل الاستجابة، مما يؤدي إلى دقة أعلى وأداء عام أفضل. تشمل النقاط البارزة الرئيسية ما يلي:
- أداء على أحدث طراز: يتصدر قائمة المتصدرين في LMArena، مما يشير إلى مستوى عالٍ من تفضيل الإنسان وأسلوب متطور.
- معايير قيادية: يتفوق في معايير الرياضيات والعلوم والترميز، مما يعرض قدراته في حل المشكلات المعقدة.
- آخر امتحان للبشرية: يحقق درجة رائعة بنسبة 18.8٪ في آخر امتحان للبشرية دون استخدام الأدوات، مما يدل على استدلال متقدم على مجموعة بيانات مصممة لالتقاط الحدود البشرية للمعرفة.
- نموذج تفكير: يتم تمكين ذلك من خلال تحسين التدريب اللاحق وبناء قدرات الاستدلال مباشرة في النموذج.
أداء الترميز المتقدم
ركزت ديب مايند بشكل مكثف على تعزيز قدرات الترميز الخاصة بجيميني. يحقق جيميني 2.5 برو تحسنًا كبيرًا مقارنة بجيميني 2.0، مما يجعله أداة قيمة للمطورين.
- تطبيقات جذابة بصريًا: يتفوق في إنشاء تطبيقات ويب جذابة بصريًا وتطبيقات التعليمات البرمجية.
- تحويل التعليمات البرمجية وتحريرها: يظهر الكفاءة في مهام تحويل التعليمات البرمجية وتحريرها.
- SWE-Bench Verified: يحقق درجة 63.8٪ في SWE-Bench Verified، وهو المعيار الصناعي لتقييمات التعليمات البرمجية، مع إعداد وكيل مخصص.
- سطر واحد من التعليمات البرمجية إلى لعبة فيديو: يمكنه إنشاء رمز قابل للتنفيذ لإنشاء لعبة فيديو من سطر واحد من التعليمات البرمجية، مما يدل على قدرات استدلال مذهلة.
بناء على نقاط قوة جيميني
يستفيد جيميني 2.5 برو من نقاط القوة الأساسية لعائلة نماذج جيميني:
- تعدد الوسائط الأصلي: يمكنه فهم ومعالجة أنواع مختلفة من البيانات، بما في ذلك النص والصوت والصور والفيديو.
- نافذة سياق طويلة: يتميز بنافذة سياق رمزية تبلغ مليون رمز (مع نافذة رمزية تبلغ 2 مليون رمز في الأفق)، مما يسمح له بفهم مجموعات البيانات الضخمة ومعالجة المشكلات المعقدة التي تتضمن مصادر معلومات متنوعة.
- إمكانية الوصول: متوفر في استوديو جوجل للذكاء الاصطناعي وتطبيق جيميني لمستخدمي جيميني المتقدم. من المخطط دمج فيرتكس ايه آي في الأسابيع القادمة.
التوفر والخطط المستقبلية
يتوفر حاليًا جيميني 2.5 برو التجريبي للمطورين ومستخدمي جيميني المتقدم للبدء في تجربته. تشجع جوجل ديب مايند المستخدمين على تقديم ملاحظات لمواصلة تحسين قدرات النموذج. سيتم الإعلان عن أسعار الاستخدام واسع النطاق في الأسابيع القادمة. تهدف الشركة إلى دمج قدرات “التفكير” هذه في جميع النماذج المستقبلية لدعم المهام الأكثر تعقيدًا وتطوير وكلاء أكثر قدرة ووعيًا بالسياق.
في الختام، يمثل جيميني 2.5 برو قفزة كبيرة إلى الأمام في قدرات الذكاء الاصطناعي، حيث يمهد الاستدلال والترميز المحسن الطريق لتطبيقات وحلول أكثر تطوراً. يشير التركيز على بناء قدرات التفكير مباشرة في النموذج إلى تحول نحو أنظمة الذكاء الاصطناعي الأكثر ذكاءً ووعيًا بالسياق. تشير حلقة التغذية الراجعة المستمرة والتكامل المخطط له في فيرتكس ايه آي إلى التزام جوجل ديب مايند بالتحسين المستمر وإمكانية الوصول الأوسع للمطورين والمؤسسات.
المصدر: Google DeepMind
Google DeepMind has just announced Gemini 2.5 Pro Experimental, their most intelligent AI model to date, representing a significant advancement in AI capabilities, particularly in reasoning and coding. This new model builds upon the Gemini foundation and introduces enhanced features designed to tackle complex problems more effectively. Gemini 2.5 Pro Experimental is now available for experimentation in Google AI Studio and Gemini Advanced, with wider availability on Vertex AI coming soon. This marks a new era of AI that focuses on deeper comprehension and contextual understanding.
Enhanced Reasoning Capabilities
Gemini 2.5 Pro is designed as a “thinking model”, capable of reasoning through problems before responding, leading to higher accuracy and better overall performance. Key highlights include:
- State-of-the-Art Performance: It tops the LMArena leaderboard, indicating a high level of human preference and sophisticated style.
- Leading Benchmarks: Excels in math, science, and coding benchmarks, showcasing its capabilities in complex problem-solving.
- Humanity’s Last Exam: Achieves a remarkable 18.8% score on Humanity’s Last Exam without tool use, demonstrating advanced reasoning on a dataset designed to capture the human frontier of knowledge.
- Thinking Model: This is enabled through improved post-training and by building reasoning capabilities directly into the model.
DeepMind has focused intensely on boosting Gemini’s coding abilities. Gemini 2.5 Pro achieves a substantial improvement over Gemini 2.0, making it a valuable tool for developers.
- Visually Compelling Applications: Excels at creating visually compelling web applications and agentic code applications.
- Code Transformation and Editing: Demonstrates proficiency in code transformation and editing tasks.
- SWE-Bench Verified: Achieves a score of 63.8% on SWE-Bench Verified, the industry standard for agentic code evaluations, with a custom agent setup.
- Single-Line Prompt to Video Game: Can generate executable code to create a video game from a single line prompt, showing incredible reasoning abilities.
Building on Gemini’s Strengths
Gemini 2.5 Pro leverages the core strengths of the Gemini model family:
- Native Multimodality: Can understand and process various data types, including text, audio, images, and video.
- Long Context Window: Features a 1 million token context window (with a 2 million token window on the horizon), allowing it to comprehend vast datasets and tackle complex problems involving diverse information sources.
- Accessibility: Available in Google AI Studio and the Gemini app for Gemini Advanced users. Vertex AI integration is planned for the coming weeks.
Availability and Future Plans
Gemini 2.5 Pro Experimental is currently available for developers and Gemini Advanced users to begin experimenting with. Google DeepMind is encouraging users to provide feedback to further improve the model’s capabilities. Pricing for scaled production use will be announced in the coming weeks. The company aims to integrate these “thinking” capabilities into all future models to support more complex tasks and the development of more capable, context-aware agents.
In conclusion, Gemini 2.5 Pro represents a significant leap forward in AI capabilities, with its enhanced reasoning and coding abilities paving the way for more sophisticated applications and solutions. The focus on building thinking capabilities directly into the model signals a shift towards more intelligent and context-aware AI systems. The ongoing feedback loop and planned integration into Vertex AI indicate Google DeepMind’s commitment to continued improvement and wider accessibility for developers and enterprises.
Source: Google DeepMind
جاري تحميل التعليقات...