صورة الذكاء الاصطناعي تطلق مشروع عن ويكيبيديا
ويكيبيديا ألمانيا تطلق مشروع "تضمين بيانات ويكي" لثورة في عالم الذكاء الاصطناعي
مبادرة رائدة لفتح المعرفة أمام الجميع
أعلنت مؤسسة ويكيبيديا ألمانيا عن إطلاق مشروع جديد يحمل اسم "مشروع تضمين بيانات ويكي" بالتعاون مع شركتي داتا ستاكس وجينا، ويهدف إلى إحداث نقلة نوعية في كيفية وصول أنظمة الذكاء الاصطناعي إلى البيانات المنظمة والموثوقة.
المشروع يركز على جعل أكثر من 120 مليون إدخال من محتوى ويكيبيديا ومشاريعها الشقيقة متاحة بصورة أكثر سهولة وفاعلية للاستخدام في التطبيقات الذكية.
البحث الدلالي بدلًا من البحث التقليدي
يعتمد المشروع على تقنية البحث الدلالي القائم على المتجهات (Vector Search)، والتي تمكّن أنظمة الذكاء الاصطناعي من فهم المعاني والعلاقات بين الكلمات والمفاهيم، بدلًا من الاكتفاء بالبحث عن كلمات مفتاحية.
هذا التطور يعني أن المستخدمين والمطورين لن يكونوا بحاجة بعد الآن إلى لغات استعلام معقدة مثل SPARQL، بل يمكنهم الاعتماد على اللغة الطبيعية للاستعلام عن البيانات.
بيانات موثوقة لتدريب الذكاء الاصطناعي
واحدة من أبرز فوائد هذه المبادرة أنها توفر بيانات عالية الجودة وموثوقة تم التحقق منها من قبل محرري ويكيبيديا، وهو ما يمثل بديلًا قويًا عن مجموعات البيانات العشوائية محدودة الدقة مثل Common Crawl التي كانت تستخدم على نطاق واسع في تدريب النماذج.
بهذا يصبح في إمكان المطورين بناء نماذج ذكاء اصطناعي أكثر دقة وموثوقية اعتمادًا على قاعدة معرفية ضخمة ومنظمة.
ربط المفاهيم وإثراء السياق
الميزة الأخرى للمشروع هي أن البيانات أصبحت مُهيكلة دلاليًا، مما يمنح الذكاء الاصطناعي القدرة على ربط المفاهيم ببعضها.
على سبيل المثال: كلمة "عالم" لن تقتصر على تعريف عام، بل ستتصل مباشرة بمعلومات عن علماء بارزين، مجالات بحثهم، ومفاهيم مرتبطة مثل الفيزياء، الكيمياء أو الأحياء. هذا يفتح المجال أمام تجارب بحث ذكية تفهم معنى السياق بدلًا من النصوص المجردة.
الذكاء الاصطناعي المفتوح والتعاوني
فيليب سعدي، مدير مشروع الذكاء الاصطناعي في ويكيبيديا، صرّح بأن المبادرة تهدف إلى إثبات أن الذكاء الاصطناعي يمكن أن يكون مفتوحًا وتعاونيًا، وليس مجرد أداة محتكرة من قبل شركات التقنية الكبرى.
كما أشار إلى أن المشروع متاح للجميع عبر منصة Toolforge، ما يعني أن أي مطور أو باحث يمكنه الاستفادة من هذا المورد لبناء تطبيقاته الخاصة دون قيود.
مستقبل البيانات المفتوحة
بهذا المشروع، تواصل ويكيبيديا تأكيد دورها كمنصة معرفية عالمية تدعم الوصول الحر للمعلومة، وفي نفس الوقت تقدم حلولًا عملية لتطوير تقنيات الذكاء الاصطناعي.
ويُتوقع أن يسهم المشروع في تسريع وتيرة الأبحاث العلمية، وتحسين جودة تطبيقات الذكاء الاصطناعي في مجالات مثل البحث الأكاديمي، التعليم، تطوير البرمجيات، والمحتوى الرقمي.