رؤى المستقبل

SensorLM: سد الفجوة بين بيانات الاستشعار القابلة للارتداء وفهم اللغة الطبيعية

AI
رؤى الذكاء والمستقبل
· · 3 دقائق قراءة
SensorLM: سد الفجوة بين بيانات الاستشعار القابلة للارتداء وفهم اللغة الطبيعية

تعمل الأجهزة القابلة للارتداء على إنشاء كميات هائلة من البيانات، ولكن فهم السياق وراء الأرقام الأولية يمثل تحديًا. تقدم Google Research SensorLM، وهي عائلة من نماذج أساس اللغة الاستشعارية المدربة على 60 مليون ساعة غير مسبوقة من بيانات الاستشعار القابلة للارتداء من أكثر من 103000 فرد. تهدف SensorLM إلى سد الفجوة بين بيانات المستشعر الأولية واللغة التي يمكن للبشر فهمها، مما يفتح الأبواب أمام رؤى صحية وشخصية. تلخص هذه المدونة الجوانب الرئيسية لأبحاث SensorLM، بما في ذلك منهجية التدريب والقدرات والتطبيقات المحتملة.

التحدي: فهم بيانات الاستشعار

تقوم الأجهزة القابلة للارتداء مثل الساعات الذكية وأجهزة تتبع اللياقة البدنية بجمع البيانات باستمرار حول معدل ضربات القلب والخطوات وأنماط النوم ومستويات النشاط. تحمل هذه البيانات إمكانات هائلة للصحة والعافية الشخصية. ومع ذلك، غالبًا ما تفتقر البيانات الأولية إلى السياق. معرفة أن معدل ضربات قلبك هو 150 نبضة في الدقيقة أقل فائدة دون معرفة ما إذا كان ذلك بسبب “ركض حاد صعودًا” أو “حدث تحدث أمام الجمهور مرهق”. يعد تدوين البيانات يدويًا بشكل كافٍ لتدريب النماذج على فهم هذا السياق مكلفًا للغاية. تعالج SensorLM هذا التحدي من خلال تعلم الروابط المعقدة بين إشارات المستشعر واللغة البشرية مباشرةً من مجموعة بيانات ضخمة.

SensorLM: تعلم “التحدث” ببيانات الاستشعار

SensorLM هي عائلة من نماذج أساس اللغة الاستشعارية المدربة مسبقًا على ما يقرب من 60 مليون ساعة من بيانات الاستشعار متعددة الوسائط من أكثر من 103000 فرد. يسمح هذا لـ SensorLM بما يلي:

  • تفسير وإنشاء أوصاف دقيقة وقابلة للقراءة من قبل الإنسان من بيانات قابلة للارتداء عالية الأبعاد.
  • ترجمة بيانات الاستشعار المعقدة إلى أوصاف لغة طبيعية ذات مغزى عبر الأبعاد الإحصائية والهيكلية والدلالية.
  • تحديد أحدث التقنيات في فهم بيانات الاستشعار.

تدريب SensorLM: خط أنابيب هرمي جديد

للتغلب على عنق الزجاجة في التعليقات التوضيحية، طور الباحثون خط أنابيب هرميًا جديدًا يقوم تلقائيًا بإنشاء تسميات نصية وصفية. تشمل الجوانب الرئيسية ما يلي:

  • إنشاء مجموعة البيانات: استخدام بيانات تم إلغاء تحديدها من 103643 شخصًا في 127 دولة وافقوا على استخدامها للبحث. تم جمع البيانات من أجهزة Fitbit أو Pixel Watch خلال شهري مارس ومايو 2024. تتكون مجموعة البيانات من ما يقرب من 2.5 مليون يوم عمل شخص.
  • إنشاء تسميات توضيحية تلقائيًا: يقوم خط الأنابيب الهرمي بحساب الإحصائيات وتحديد الاتجاهات ووصف الأحداث مباشرةً من بيانات المستشعر. يؤدي هذا إلى أتمتة إنشاء التسميات التوضيحية، مما يجعل مجموعة بيانات ذات حجم غير مسبوق ممكنة.

بنية SensorLM: الجمع بين التعلم التبايني والتوليدي

توحد بنية SensorLM استراتيجيات التدريب المسبق متعددة الوسائط البارزة:

  • التعلم التبايني: يتعلم النموذج مطابقة أجزاء بيانات المستشعر مع الأوصاف النصية المقابلة، مما يمكنه من التمييز بين الأنشطة والحالات المختلفة.
    • مثال: التمييز بين “السباحة الخفيفة” و “تمرين القوة”.
  • التدريب المسبق التوليدي: يتعلم النموذج إنشاء تسميات نصية مباشرة من بيانات المستشعر، مما يسمح له بإنتاج أوصاف غنية واعية بالسياق.

القدرات الرئيسية وسلوكيات التحجيم

تُظهر SensorLM العديد من القدرات الرئيسية، بما في ذلك:

  • فهم المستشعر بدون رصاصة: تصنيف النشاط بدقة من 20 نشاطًا دون أي ضبط دقيق.
  • التعلم ببضعة طلقات: التعلم بسرعة من عدد محدود من الأمثلة.
  • محاذاة واسترجاع المستشعر والنص: تمكين الفهم متعدد الوسائط بين بيانات المستشعر والأوصاف اللغوية. الاستعلام عن الأوصاف باستخدام مدخلات المستشعر، أو العثور على أنماط مستشعر محددة باستخدام اللغة الطبيعية.
  • إنشاء تسميات توضيحية للمستشعر: إنشاء تسميات توضيحية متماسكة وصحيحة واقعيًا مباشرة من بيانات المستشعر، متجاوزة نماذج اللغة العامة.
  • سلوك التحجيم: يتحسن الأداء باستمرار مع المزيد من البيانات وأحجام النماذج الأكبر وزيادة الحوسبة.

خاتمة

يمثل SensorLM خطوة مهمة نحو إطلاق العنان لفهم بيانات المستشعر القابلة للارتداء من خلال اللغة الطبيعية. من خلال سد الفجوة بين البيانات الأولية واللغة التي يمكن فهمها من قبل الإنسان، تمهد SensorLM الطريق لرؤى صحية شخصية، ومدربين صحيين رقميين، وأدوات مراقبة سريرية، وتطبيقات للعافية الشخصية. تتضمن الخطط المستقبلية توسيع نطاق بيانات التدريب المسبق إلى مجالات جديدة مثل صحة التمثيل الغذائي وتحليل النوم.


المصدر: Google Research

مقالات ذات صلة

التعليقات

البريد لن يُنشر - يُستخدم للصورة الرمزية فقط

جاري تحميل التعليقات...