كشفت Google DeepMind عن TxGemma، وهي مجموعة من نماذج لغوية كبيرة مفتوحة المصدر (LLMs) مصممة لتسريع وتحسين كفاءة تطوير الأدوية العلاجية. بالاعتماد على أساس عائلة نماذج Gemma، تهدف TxGemma إلى معالجة التكاليف المرتفعة والجداول الزمنية الطويلة ومعدلات الفشل العالية المرتبطة بالطرق التقليدية لاكتشاف الأدوية. من خلال الاستفادة من قوة الذكاء الاصطناعي للتنبؤ وفهم خصائص الكيانات العلاجية طوال عملية التطوير، تعد TxGemma بتقصير الوقت من المختبر إلى السرير وتقليل نفقات التطوير.
من Tx-LLM إلى TxGemma: نهج مفتوح
بعد النجاح والاهتمام بنموذجهم السابق، Tx-LLM، قامت Google DeepMind بتطوير TxGemma كخليفة مفتوح المصدر. توفر TxGemma للمطورين القدرة على تكييف النماذج مع بياناتهم ومهامهم العلاجية، مما يعزز الابتكار والتعاون.
- أحجام النماذج: يتوفر TxGemma بثلاثة أحجام: 2B و 9B و 27B من المعلمات، لتلبية متطلبات الموارد الحسابية المختلفة.
- إصدارات “التنبؤ”: يتضمن كل حجم إصدار “تنبؤ” تم ضبطه بدقة لمهام ضيقة المصدر من Therapeutic Data Commons، مثل التنبؤ بسمية الجزيء.
- تغطية المهام: تغطي هذه المهام نطاقًا واسعًا، بما في ذلك التصنيف (مثل التنبؤ بنفاذية حاجز الدم في الدماغ)، والانحدار (مثل التنبؤ بتقارب ربط الدواء)، والتوليد (مثل إنشاء مجموعات المتفاعلات من منتج معين).
- الأداء: يُظهر أكبر نموذج TxGemma (إصدار التنبؤ 27B) أداءً قويًا، حيث يتجاوز أو يطابق قدرات Tx-LLM وحتى يتفوق على النماذج المتخصصة المصممة لمهام فردية أو ينافسها.
الذكاء الاصطناعي للمحادثة من أجل رؤى محسنة
بالإضافة إلى إصدارات “التنبؤ”، تتضمن TxGemma إصدارات “المحادثة” 9B و 27B المصممة لتحليل البيانات العلاجية للمحادثة.
- ضبط التعليمات: تشتمل هذه النماذج على بيانات ضبط التعليمات العامة، مما يمكنها من شرح أسبابها والإجابة على الأسئلة المعقدة والمشاركة في مناقشات متعددة الدورات.
- القابلية للتفسير: يمكن للباحثين استجواب TxGemma-Chat للحصول على تفسيرات لنتائجها، واكتساب رؤى أعمق حول الآليات الأساسية. على سبيل المثال، السؤال عن سبب توقع أن يكون جزيء معين سامًا وتلقي تفسيرًا بناءً على تركيبه.
- المقايضة: يأتي هذا القدرة للمحادثة مع مقايضة أداء طفيفة في المهام العلاجية الأولية مقارنة بإصدارات “التنبؤ”.
الضبط الدقيق والتخصيص
إدراكًا لأهمية التخصيص، تقدم Google DeepMind دفتر ملاحظات Colab كمثال للضبط الدقيق لمساعدة المطورين على تكييف TxGemma مع بياناتهم ومهامهم العلاجية الخاصة.
- مجموعة بيانات TrialBench: يستخدم دفتر الملاحظات مجموعة بيانات TrialBench لإظهار الضبط الدقيق للتنبؤ بالأحداث السلبية في التجارب السريرية.
- تكامل البيانات الخاصة: يسمح الضبط الدقيق للباحثين بالاستفادة من بياناتهم الخاصة، وإنشاء نماذج مصممة خصيصًا لتلبية احتياجاتهم البحثية الفريدة.
- دقة محسّنة: يمكن أن يؤدي هذا التخصيص إلى تنبؤات أكثر دقة، مما يساعد الباحثين في تقييم سلامة وفعالية العلاجات الجديدة المحتملة.
Agentic-Tx: تنسيق مهام سير العمل لاكتشاف متقدم
بالتجاوز عن التنبؤات بخطوة واحدة، تعرض Google DeepMind كيف يمكن دمج TxGemma في أنظمة عاملة مثل Agentic-Tx لمعالجة تحديات بحثية أكثر تعقيدًا.
- مدعوم بـ Gemini 2.0 Pro: Agentic-Tx، المدعوم بـ Gemini 2.0 Pro، هو نظام عامل يركز على العلاج ومجهز بـ 18 أداة.
- مجموعة أدوات متنوعة: تشتمل مجموعة الأدوات على TxGemma للاستدلال متعدد الخطوات، وأدوات البحث العامة (PubMed و Wikipedia و Web)، وأدوات جزيئية وجينية وبروتينية محددة.
- أداء على أحدث طراز: يحقق Agentic-Tx نتائج على أحدث طراز في مهام الكيمياء والبيولوجيا المكثفة للاستدلال، كما يتضح من المعايير القياسية مثل Humanity’s Last Exam و ChemBench.
- تنسيق مهام سير العمل: يتم توفير دفتر ملاحظات Colab لتوضيح كيف يمكن لـ Agentic-Tx تنسيق مهام سير عمل معقدة والإجابة على أسئلة بحثية متعددة الخطوات.
البدء مع TxGemma
يمكن الوصول إلى TxGemma بسهولة على كل من Vertex AI Model Garden و Hugging Face، مما يسمح للباحثين والمطورين باستكشاف النماذج وتجربتها بسهولة. تشجع Google على الاستكشاف والتجريب وتقديم الملاحظات لدفع المزيد من التحسينات. كنموذج مفتوح، تم تصميم TxGemma ليتم تحسينه بشكل أكبر من خلال الضبط الدقيق مع حالات استخدام محددة لتطوير العلاج. ومن المتوقع أن تساهم مساهمة المجتمع بشكل كبير في تسريع اكتشاف العلاج.
في الختام، تمثل TxGemma من Google DeepMind خطوة مهمة إلى الأمام في الاستفادة من الذكاء الاصطناعي في تطوير الأدوية العلاجية. من خلال توفير نماذج وأنظمة عاملة مفتوحة المصدر وقابلة للتخصيص، تعمل Google على تمكين الباحثين والمطورين لتسريع اكتشاف علاجات جديدة وتحسين نتائج المرضى.
المصدر: Google
Google DeepMind has unveiled TxGemma, a suite of open-source large language models (LLMs) designed to accelerate and improve the efficiency of therapeutic drug development. Building upon the foundation of the Gemma family of models, TxGemma aims to tackle the high costs, lengthy timelines, and high failure rates associated with traditional drug discovery methods. By leveraging the power of AI to predict and understand the properties of therapeutic entities throughout the development process, TxGemma promises to shorten the time from lab to bedside and reduce development expenses.
From Tx-LLM to TxGemma: An Open Approach
Following the success and interest in their previous model, Tx-LLM, Google DeepMind has developed TxGemma as its open-source successor. TxGemma offers developers the ability to adapt the models to their own therapeutic data and tasks, fostering innovation and collaboration.
- Model Sizes: TxGemma is available in three sizes: 2B, 9B, and 27B parameters, catering to different computational resource requirements.
- “Predict” Versions: Each size includes a “predict” version specifically fine-tuned for narrow tasks sourced from the Therapeutic Data Commons, such as predicting molecule toxicity.
- Task Coverage: These tasks cover a broad range, including classification (e.g., predicting blood-brain barrier permeability), regression (e.g., predicting drug binding affinity), and generation (e.g., generating reactant sets from a given product).
- Performance: The largest TxGemma model (27B predict version) demonstrates strong performance, surpassing or matching the capabilities of Tx-LLM and even rivaling or outperforming specialized models designed for single tasks.
Conversational AI for Enhanced Insights
In addition to the “predict” versions, TxGemma includes 9B and 27B “chat” versions designed for conversational therapeutic data analysis.
- Instruction Tuning: These models incorporate general instruction tuning data, enabling them to explain their reasoning, answer complex questions, and engage in multi-turn discussions.
- Explainability: Researchers can probe TxGemma-Chat for explanations behind its predictions, gaining deeper insights into the underlying mechanisms. For example, asking why a particular molecule is predicted to be toxic and receiving an explanation based on its structure.
- Trade-off: This conversational capability comes with a slight performance trade-off on raw therapeutic tasks compared to the “predict” versions.
Fine-Tuning and Customization
Recognizing the importance of customization, Google DeepMind provides a fine-tuning example Colab notebook to help developers adapt TxGemma to their specific therapeutic data and tasks.
- TrialBench Dataset: The notebook uses the TrialBench dataset to demonstrate fine-tuning for predicting adverse events in clinical trials.
- Proprietary Data Integration: Fine-tuning allows researchers to leverage their proprietary data, creating models tailored to their unique research needs.
- Improved Accuracy: This customization can potentially lead to even more accurate predictions, aiding researchers in assessing the safety and effectiveness of potential new therapies.
Agentic-Tx: Orchestrating Workflows for Advanced Discovery
Going beyond single-step predictions, Google DeepMind is showcasing how TxGemma can be integrated into agentic systems like Agentic-Tx to tackle more complex research challenges.
- Gemini 2.0 Pro Powered: Agentic-Tx, powered by Gemini 2.0 Pro, is a therapeutics-focused agentic system equipped with 18 tools.
- Diverse Toolset: The toolset includes TxGemma for multi-step reasoning, general search tools (PubMed, Wikipedia, Web), and specific molecular, gene, and protein tools.
- State-of-the-Art Performance: Agentic-Tx achieves state-of-the-art results on reasoning-intensive chemistry and biology tasks, as demonstrated by benchmarks like Humanity’s Last Exam and ChemBench.
- Workflow Orchestration: A Colab notebook is provided to demonstrate how Agentic-Tx can orchestrate complex workflows and answer multi-step research questions.
Getting Started with TxGemma
TxGemma is readily accessible on both Vertex AI Model Garden and Hugging Face, allowing researchers and developers to easily explore and experiment with the models. Google encourages exploration, experimentation, and feedback to drive further improvements. As an open model, TxGemma is designed to be further improved through fine-tuning with specific therapeutic development use-cases. The community’s contribution is anticipated to significantly accelerate therapeutic discovery.
In conclusion, Google DeepMind’s TxGemma represents a significant step forward in leveraging AI for therapeutic drug development. By providing open-source, customizable models and agentic systems, Google is empowering researchers and developers to accelerate the discovery of new therapies and improve patient outcomes.
Source: Google
جاري تحميل التعليقات...