استرجاع المعلومات متعددة الوسائط باستخدام الشبكات العصبية الاصطناعية

استرجاع المعلومات متعددة الوسائط باستخدام الشبكات العصبية الاصطناعية

 

 الملخص

 مها محمود – وجدان جابر الكبيسي – بلال الخطيب

 

تُبرز أهمية استرجاع المعلومات متعددة الوسائط (MIR) من خلال الكم الهائل من المعلومات المتوفرة على الإنترنت. تشمل الأمثلة على بيانات الوسائط المتعددة الخام الصور والصوت والفيديو والنصوص. يمثل تمثيل مفهوم الإدراك البشري وكيف يمكن للغة الآلة استيعابه (الفجوة الدلالية لاسترجاع المعلومات متعددة الوسائط) تحديًا كبيرًا. ومع ذلك، يهدف هذا البحث إلى تحسين نموذج استرجاع المعلومات لاسترداد البيانات من الوسائط المتعددة. يتم تنفيذ ذلك من خلال الاستفادة من مجموعة متنوعة من الخوارزميات التي تخضع للتدريب والاختبار لاستخراج النموذج.

تتضمن إحدى هذه الخوارزميات استخراج المعلومات النصية بناءً على طبيعة لغة الاستعلام باستخدام نموذج الفضاء المتجهي (VSM) والفهرسة الدلالية الكامنة (LSI)

. كما تستخدم تقنية أخرى تحليل الموجات المنحنية (Curvelet Decomposition) ومعايير إحصائية مثل المتوسط، والانحراف المعياري، وطاقة الإشارة لاستعادة هذه الخصائص. بالإضافة إلى ذلك، يتم استخدام طريقة تعتمد على تحويل الموجة المنفصلة (DWT) وخصائص الإشارة لاسترجاع الإشارات الصوتية. وأخيرًا، يتم تصميم الشبكة العصبية وتدريبها على مجموعة من الصور المتعددة الوسائط المختلفة.

تم استخدام الميزات المستخلصة لتقديم نظام فعال للغاية لاسترجاع الوسائط المتعددة يعمل على مجموعات بيانات كبيرة ومتعددة الأنماط.

 

Multimedia information retrieval using artificial neural network | Mahmood | IAES International Journal of Artificial Intelligence (IJ-AI)