أطلقت مكتبة كلية الحقوق بجامعة هارفارد مبادرة البيانات المؤسسية (IDI)، وهي مبادرة بحثية مخصصة لدعم المؤسسات المعرفية في جعل مجموعات بياناتها متاحة لتطوير الذكاء الاصطناعي (AI). تهدف هذه المبادرة إلى سد الفجوة بين المكتبات والجامعات والوكالات الحكومية ومجتمع الذكاء الاصطناعي من خلال تنظيم وتحليل ونشر المجموعات المؤسسية كبيانات. تعتقد مبادرة IDI أن زيادة الوصول إلى البيانات من هذه المؤسسات سيؤدي إلى أنظمة ذكاء اصطناعي أكثر تنوعًا وشمولية وأمانًا.
المهمة الأساسية لمبادرة IDI
الهدف الرئيسي لمبادرة IDI هو تمكين المؤسسات المعرفية من توفير وصول واسع إلى مجموعاتها الواسعة والفريدة من نوعها، والتي لا يزال الكثير منها غير مستغل. من خلال التعاون مع مجتمع الذكاء الاصطناعي، تسعى مبادرة IDI إلى جعل هذه المعلومات في متناول رواد المكتبات التقليديين وتدريب الذكاء الاصطناعي، مع الاعتراف بالخبرة التي تمتلكها المؤسسات المعرفية في مجالات مثل تصنيف المعلومات والسياق الثقافي وأطر الخصوصية. يهدف هذا الجهد التعاوني إلى مواءمة مصالح مطوري نماذج الذكاء الاصطناعي مع أهداف المؤسسات المعرفية.
المبادرات والمشاريع الرئيسية
تشرع مبادرة IDI في العديد من المبادرات الرئيسية لتحقيق أهدافها:
- مجموعة كتب الملكية العامة: تنقيح وإصدار ما يقرب من مليون كتاب من الملكية العامة تم مسحها ضوئيًا في مكتبة هارفارد كجزء من مشروع كتب Google.
- التعاون في مجال الصحف التاريخية: الشراكة مع مكتبة بوسطن العامة لإتاحة ملايين الصفحات من الصحف التاريخية التي يصعب العثور عليها. يتضمن ذلك استخدام طرق جديدة لاستخراج النص بدقة من تخطيطات الصحف، والتي يصعب معالجتها بشكل ملحوظ.
- الندوة: استضافة ندوة في ربيع هذا العام في كلية الحقوق بجامعة هارفارد لربط المؤسسات ومجتمعات الذكاء الاصطناعي، وتعزيز التعاون واستكشاف المواءمة.
- توسيع أنواع البيانات: تسعى بنشاط إلى التعاون عبر جميع أشكال البيانات، بما في ذلك البيانات العلمية والطبية الحيوية.
فوائد لمجتمع الذكاء الاصطناعي
تتوقع مبادرة IDI فوائد كبيرة لمجتمع الذكاء الاصطناعي، بما في ذلك:
- حاجز أقل للدخول: زيادة الوصول إلى البيانات سيقلل من الحواجز التي تعترض طريق إنشاء النماذج، مما يسمح لمجموعات أكثر تنوعًا بالمشاركة في تطوير الذكاء الاصطناعي.
- تمثيل محسن: زيادة التمثيل اللغوي والثقافي في نماذج الذكاء الاصطناعي، مما يمكنها من خدمة مجموعة أوسع من المستخدمين.
- قدرات جديدة: فتح الأبواب أمام اكتشافات علمية وطبية جديدة من خلال الوصول إلى المعرفة المتخصصة.
- ذكاء اصطناعي أكثر أمانًا وشفافية: المساهمة في تطوير أنظمة ذكاء اصطناعي أكثر أمانًا وشفافية من خلال الوصول إلى المعرفة المنسقة والمحافظ عليها.
المشاركة المجتمعية والدعم
تسعى مبادرة IDI بنشاط إلى مشاركة مختلف أصحاب المصلحة:
- المؤسسات المعرفية: تشجيع المؤسسات على مشاركة التحديات والاحتياجات التي تواجهها في جعل بياناتها متاحة.
- باحثو الذكاء الاصطناعي / تعلم الآلة: دعوة للمساهمة في المشاريع والأبحاث الجارية.
- الأكاديميون: الترحيب بدمج العمل ووجهات النظر من علماء الإنسانيات الرقمية والباحثين الآخرين.
تحظى المبادرة بدعم سخي من تبرعات من Microsoft و OpenAI، مع جهود مستمرة لبناء قاعدة متنوعة من الدعم الخيري والصناعي.
خاتمة
تمثل مبادرة البيانات المؤسسية خطوة حاسمة في سد الفجوة بين المؤسسات المعرفية والعالم المتطور بسرعة للذكاء الاصطناعي. من خلال تعزيز التعاون وزيادة الوصول إلى مجموعات البيانات القيمة، تهدف مبادرة IDI إلى ضمان أن تطوير الذكاء الاصطناعي يرتكز على عمق وتنوع وتعقيد المعرفة البشرية. تتمتع هذه المبادرة بالقدرة على إطلاق فرص جديدة للابتكار وتعزيز الشمولية وتشكيل مستقبل الذكاء الاصطناعي لصالح الجميع.
المصدر: Harvard Law School Library
The Harvard Law School Library has launched the Institutional Data Initiative (IDI), a research initiative dedicated to supporting knowledge institutions in making their data collections accessible for artificial intelligence (AI) development. This initiative aims to bridge the gap between libraries, universities, government agencies, and the AI community by structuring, analyzing, and publishing institutional collections as data. The IDI believes that increased access to data from these institutions will lead to more diverse, inclusive, and safer AI systems.
The Core Mission of IDI
The IDI’s primary goal is to empower knowledge institutions to provide broad access to their vast and unique collections, much of which remains untapped. By collaborating with the AI community, IDI seeks to make this information accessible for traditional patron access and AI training, recognizing the expertise that knowledge institutions possess in areas such as information classification, cultural context, and privacy frameworks. This collaborative effort aims to align the interests of AI model developers with the goals of knowledge institutions.
Key Initiatives and Projects
The IDI is embarking on several key initiatives to achieve its goals:
- Public Domain Book Corpus: Refining and releasing nearly one million public domain books scanned at Harvard Library as part of the Google Books project.
- Historical Newspaper Collaboration: Partnering with the Boston Public Library to make millions of pages from hard-to-find historical newspapers accessible. This involves employing new methods to extract text accurately from newspaper layouts, which are notoriously difficult to process.
- Symposium: Hosting a spring symposium at Harvard Law School to connect institutional and AI communities, fostering collaboration and exploring alignment.
- Expanding Data Types: Actively seeking collaborations across all forms of data, including scientific and biomedical data.
The IDI anticipates significant benefits for the AI community, including:
- Lower Barrier to Entry: Increased access to data will reduce the barriers to entry for model creation, allowing more diverse groups to participate in AI development.
- Improved Representation: Greater language and cultural representation in AI models, enabling them to serve a broader range of users.
- New Capabilities: Opening doors to new scientific and medical discoveries through access to specialized knowledge.
- Safer and Transparent AI: Contributing to the development of safer and more transparent AI systems through access to curated and stewarded knowledge.
Community Engagement and Support
The IDI actively seeks participation from various stakeholders:
- Knowledge Institutions: Encouraging institutions to share their challenges and needs in making their data accessible.
- AI-ML Researchers: Inviting contributions to ongoing projects and research.
- Academics: Welcoming integration of work and perspectives from digital humanists and other scholars.
The initiative is generously supported by gifts from Microsoft and OpenAI, with ongoing efforts to build a diverse base of philanthropic and industry support.
Conclusion
The Institutional Data Initiative represents a crucial step in bridging the gap between knowledge institutions and the rapidly evolving world of AI. By fostering collaboration and increasing access to valuable data collections, the IDI aims to ensure that AI development is grounded in the depth, diversity, and complexity of human knowledge. This initiative has the potential to unlock new opportunities for innovation, promote inclusivity, and shape the future of AI for the benefit of all.
Source: Harvard Law School Library
جاري تحميل التعليقات...