رؤى المستقبل

سد الفجوة الرقمية اللغوية: لماذا تكنولوجيا اللغة الشاملة مهمة

AI
رؤى الذكاء والمستقبل
· · 3 دقائق قراءة
سد الفجوة الرقمية اللغوية: لماذا تكنولوجيا اللغة الشاملة مهمة

تشكل الفجوة الرقمية اللغوية، التي تتميز بالتباين في توافر المحتوى الرقمي وإمكانية الوصول إليه والدعم التكنولوجي بين اللغات السائدة واللغات قليلة الموارد، تحديًا كبيرًا في عصر الذكاء الاصطناعي. يسلط تعليق حديث لمؤسسة بروكينجز بقلم تشيناسا ت. أوكولو وماري تانو الضوء على كيف يمكن لتقنيات الترجمة الآلية متعددة اللغات أن تزيد أو تخفف من هذه الفجوة. يؤكد تحليلهما على الحاجة الماسة إلى تجاوز مجرد إضافة المزيد من اللغات إلى مجموعات البيانات والتركيز بدلاً من ذلك على معالجة ديناميكيات القوة والتحيزات والاعتبارات الأخلاقية التي تشكل كيفية تمثيل هذه اللغات واستخدامها في المجال الرقمي.

الفجوة الرقمية اللغوية وأسبابها الجذرية

يؤكد المؤلفان على الفجوة المتزايدة بين لغات مثل الإنجليزية والإسبانية والصينية والفرنسية واللغات الأقل دعمًا مثل الملغاشية والنافاجو. ينبع هذا التفاوت من عدة عوامل:

  • نقص الاستثمار: عدم كفاية الاستثمار في تكنولوجيا اللغة للغات قليلة الموارد.
  • التمثيل المحدود: عدم كفاية الإدراج في المنصات الرقمية والتعليمية.
  • بيانات تدريب الذكاء الاصطناعي المتحيزة: عدم كفاية الإدراج في مجموعات بيانات تدريب الذكاء الاصطناعي، مما يؤدي إلى خوارزميات متحيزة.

تتفاقم هذه الفجوة الرقمية اللغوية بسبب استغلال مدققي البيانات في الجنوب العالمي، الذين غالبًا ما يتقاضون أجورًا زهيدة ويتم تجاهل رؤاهم الثقافية على الرغم من دورهم الحاسم في تطوير الذكاء الاصطناعي.

الوعد والخطر في الترجمة الآلية متعددة اللغات

في حين أن شركات مثل Google و OpenAI قد حققت خطوات واسعة في دعم العديد من اللغات في نماذج الترجمة الخاصة بها، يجادل المؤلفان بأن هذه الجهود غالبًا ما تكون قاصرة بالنسبة للغات قليلة الموارد. ويشيرون إلى أن:

  • غالبًا ما تعطي الشركات الكبرى الأولوية للتوسع عبر اللغات عالية الموارد، وتضحي بالعمق والجودة في اللغات الأقل شيوعًا.
  • تحتوي مجموعات البيانات متعددة اللغات بشكل متكرر على أخطاء وتسميات خاطئة ونصوص منخفضة الجودة.
  • أظهرت الدراسات أن الادعاءات المتعلقة بالترجمة عالية الجودة للغات قليلة الموارد من قبل شركات التكنولوجيا الكبرى غالبًا ما تكون مبالغ فيها، خاصة فيما يتعلق بالخطاب العامي.

تظهر المبادرات المحلية، على النقيض من ذلك، فهمًا أفضل للسياقات الثقافية واللغوية، مما يؤدي إلى ترجمات عالية الجودة.

أهمية التوطين والمشاركة المجتمعية

يؤكد التعليق على الحاجة الماسة إلى المبادرات المحلية الحساسة للسياقات الثقافية والاجتماعية الفريدة لمجتمعات معينة. يحذر المؤلفان من الاعتماد فقط على نماذج اللغة التجارية الكبيرة، مشيرين إلى احتمالية إساءة الاستخدام والضرر. على سبيل المثال، فإن تضمين Google Translate للغة الغجرية، على الرغم من أنه يبدو مفيدًا، يحمل مخاطر التضليل والتلاعب دون موافقة المجتمع. وهذا يستلزم:

  • موافقة المجتمع: المشاركة النشطة والموافقة من المجتمعات في كيفية استخدام لغاتهم في نماذج الترجمة.
  • الحماية الثقافية: التأكد من أن الترجمات تحترم وتحمي التراث الثقافي، وتحمي من سوء الاستخدام.

طريق إلى الأمام: موارد عادلة وتعاون

يتطلب سد الفجوة الرقمية اللغوية اتباع نهج متعدد الأوجه:

  • الاعتراف بعمال البيانات: تقدير عمال البيانات كمساهمين ومصادر للمعرفة، وليسوا مجرد عمالة رخيصة.
  • إشراك الخبراء المحليين: إشراك الخبراء المحليين دون تدريب تقني رسمي في عملية تطوير الترجمة الآلية.
  • التعاون مع المؤسسات: الشراكة مع المؤسسات الأكاديمية المحلية والمنظمات المجتمعية للحصول على الخبرة اللغوية والتحقق من البيانات.
  • دعم المبادرات المحلية: توفير التمويل والموارد للمشاريع الصغيرة التي تركز على السياقات اللغوية والثقافية المحددة، مثل Ghana NLP و Lesan.ai و Masakhane.

يتم تسليط الضوء على مبادرات مثل مشروع Elevate Black Voices (EBV) كأمثلة ناجحة على المشاركة المجتمعية وجمع البيانات بشكل مسؤول. يهدف المشروع، وهو تعاون بين Google وجامعة Howard، إلى إنشاء مجموعة بيانات لغوية عالية الجودة للغة الإنجليزية الأمريكية الأفريقية (AAE) مملوكة ومدارة من قبل الجامعة، مما يضمن استفادة المجتمع الأسود من البيانات.

يختتم المؤلفان بأن مستقبلًا رقميًا عادلاً ومنصفًا حقًا يستلزم تعزيز الجهود التعاونية وبناء الخبرات المحلية وضمان ممارسات العمل العادلة، مما يسمح لجميع اللغات والمتحدثين بها بالمشاركة الكاملة في التقدم التكنولوجي والاستفادة منه.


المصدر: TechTank

مقالات ذات صلة

التعليقات

البريد لن يُنشر - يُستخدم للصورة الرمزية فقط

جاري تحميل التعليقات...