
الذكاء الاصطناعي وتطور نماذج اللغات الكبيرة LLMs: مدخل إلى Llama 3.1
م.د. محمد صلاح إبراهيم
في السنوات الأخيرة، شهد العالم تطورًا هائلًا في مجال الذكاء الاصطناعي، وخاصة فيما يتعلق بتطوير نماذج اللغات الكبيرة (Large Language Models - LLMs). هذه النماذج قادرة على فهم النصوص المكتوبة والشفهية وتوليد استجابات ذكية تحاكي التفاعل البشري. وقد أحدثت ثورة في عدة مجالات، من بينها التعليم، الصحافة، الطب، التجارة، والتكنولوجيا. يوضح الشكل ادناه كيف انك كمستخدم ترسل نص او صوت او صورة الى نماذج اللغات الكبيرة ثم تقوم هذه النماذج بتفسير ما ارسلته وتعطي على أساسها أجوبة او تحليل للبيانات او صور وغيرها.
شكل رقم 1 كيفية عمل نماذج اللغات الكبيرة ومعالجة البيانات وتوفير الإجابة المرتبطة بها
من بين هذه النماذج، ظهر نموذج ChatGPT الذي يعتمد على تقنية GPT-4 من شركة OpenAI كأحد أشهر النماذج، حيث تم تدريبه على كميات ضخمة من البيانات لتقديم إجابات دقيقة وسريعة في مختلف المجالات. ربما لاحظت كيف يتم استخدامه في حياتنا اليومية، سواء من خلال المساعدات الشخصية مثل Siri أو Google Assistant، أو حتى في تطبيقات الشات الذكية على مواقع الويب. الشكل 2 يوضح كيفية عمل روبتات المحادثة ومعالجة الاستفسار وارسال الجواب من جديد الى المستخدم.
شكل رقم 2 يوضح كيفية استلام روبوتات المحادثة الأسئلة من المستخدم وتحليلها والبحث في قاعدة بيانات المعرفة واسترجاع الجواب للمستخدم
ما هي نماذج اللغات الكبيرة (LLMs)؟
نماذج اللغات الكبيرة هي تقنيات تعتمد على الذكاء الاصطناعي وتعلم الآلة، وتعمل على فهم وتحليل النصوص الكبيرة جدًا لتوليد استجابات شبيهة بالبشر. يتم تدريب هذه النماذج على كميات هائلة من البيانات التي تشمل مقالات، كتب، محادثات، وتفاعلات بشرية، ما يجعلها قادرة على الرد بذكاء على الأسئلة والتفاعل مع المستخدمين بطريقة طبيعية.
لكن، ما يميز هذه النماذج هو قدرتها على "التعلم" من البيانات التي تم تغذيتها بها. كلما زادت كمية البيانات التي تتعرض لها، تحسنت قدرتها على تقديم استجابات أكثر دقة وعمقًا. لكن ما يجعلها رائعة هو أنها تستطيع العمل في مجالات متعددة، فهي ليست محدودة بمجال معين. يمكنك سؤالها عن البرمجة، التاريخ، الأدب، أو حتى الطب، وستتمكن من تقديم إجابات دقيقة بشكل مذهل.
مشكلة التكلفة والوصول إلى هذه النماذج
رغم أن ChatGPT ونماذج GPT الأخرى شهيرة وفعالة، فإن استخدامها في المشاريع الخاصة أو التطبيقات التجارية يتطلب تكلفة عالية. على سبيل المثال، لاستخدام ChatGPT في تطبيق معين، يتعين عليك شراء اشتراك من شركة OpenAI. هذا الاشتراك يمكن أن يكون مكلفًا بالنسبة للمطورين أو الباحثين، خاصة في البيئات التي تفتقر إلى الموارد مثل العراق.
هذه التكلفة قد تشكل عائقًا أمام المطورين المبتدئين أو المشاريع الصغيرة التي ترغب في استخدام الذكاء الاصطناعي في بناء تطبيقاتها. حتى إذا تمكنت من الحصول على الاشتراك، قد تجد نفسك محدودًا بعدد المرات التي يمكنك فيها استخدام النموذج. ولهذا السبب، برزت الحاجة إلى نماذج مفتوحة المصدر التي توفر إمكانيات مشابهة ولكن بتكلفة أقل أو حتى مجانًا.
Llama 3.1: الحل المجاني والمفتوح
هنا يأتي دور Llama 3.1، النموذج الذي تقدمه شركة Meta كبديل مجاني مفتوح المصدر. Llama 3.1 هو نموذج لغة كبير يتنافس مع نماذج مثل GPT-4 ولكنه مجاني بالكامل ويتيح للمطورين والباحثين تخصيصه واستخدامه وفقًا لاحتياجاتهم الخاصة. يعتبر Llama 3.1 فرصة عظيمة للمبرمجين الذين يرغبون في تطوير تطبيقات تعتمد على الذكاء الاصطناعي دون الحاجة إلى دفع مبالغ طائلة.
يتم تقديم Llama 3.1 بثلاثة إصدارات تختلف من حيث القوة والتعقيد: 8 مليارات معاملات (8B)، 70 مليار معاملات (70B)، و405 مليارات معاملات (405B). كلما زادت عدد المعاملات، زادت قدرة النموذج على تقديم استجابات دقيقة ومعقدة. شكل رقم 3 يمثل صورة حيوان اللاما الذي سمي نموذج فيس بوك على أساسه.
شكل رقم 3 حيوان اللاما الذي اخذ على اساسة نموذج اللغة الكبير Llama 3.1
اللاما 3.1 حاليا غير متوفرة في العراق كما موضح في الصور رقم 4 حيث ان ميتا الاشعار بعدم توفرها في العراق ولكن أعلنت انها سوف تكون متوفرة قريبا.
شكل رقم 4 عدم توفر ميتا AI في العراق
ولكن هناك عدة طرق للوصول الى اللاما 3.1 من خلال استخدام ال VPN وكذلك مواقع المطورين والمبرمجين مثل GitHub و Kaggle و Google Colab
لماذا Llama 3.1 مهم؟
Llama 3.1 ليس مجرد بديل مجاني؛ بل هو أداة قوية يمكن استخدامها في العديد من المجالات. إليك بعض الأسباب التي تجعل هذا النموذج مهمًا:
1. المرونة والتخصيص: بفضل كونه مفتوح المصدر، يمكن للمطورين الوصول إلى الكود الخاص بالنموذج وإجراء التعديلات اللازمة لتخصيصه وفقًا لمتطلبات مشاريعهم. على سبيل المثال، يمكن تخصيص Llama 3.1 ليصبح متخصصًا في مجال معين مثل التعليم أو الصحة أو حتى الأعمال التجارية.
2. التعليم المجاني: يُعد Llama 3.1 فرصة للطلاب والأكاديميين في الدول التي تعاني من قلة الموارد. يمكن استخدامه في الأبحاث الأكاديمية أو لبناء مشاريع تجريبية دون الحاجة إلى إنفاق أموال كبيرة.
3. التطور المستقبلي: يمكن بناء تطبيقات معقدة تعتمد على هذا النموذج في مجالات مثل الروبوتات التفاعلية، أنظمة خدمة العملاء الذكية، التطبيقات التعليمية، وحتى في الصحافة لتوليد محتوى آليًا.
استخدامات Llama 3.1 في العالم الواقعي
1. الروبوتات التفاعلية: يمكن استخدام Llama 3.1 في تطوير روبوتات تفاعلية قادرة على فهم الأوامر الصوتية وتنفيذها. تخيل تطوير روبوت صغير يتفاعل مع المستخدمين، سواء في المجال التعليمي أو في تقديم الدعم الفني للعملاء.
2. التحليل الأكاديمي: في المجال الأكاديمي، يمكن استخدام Llama 3.1 في تحليل الأبحاث العلمية، توليد ملخصات أو حتى كتابة مقالات علمية استنادًا إلى البيانات المدخلة.
3. التعليم التفاعلي: في مجال التعليم، يمكن تطوير أنظمة تفاعلية تعتمد على Llama 3.1 لتقديم مواد تعليمية مخصصة للطلاب بناءً على احتياجاتهم ومستوياتهم. يمكن أن تكون هذه الأنظمة مفيدة في تعلم اللغات أو تقديم دروس خاصة في مجالات معينة مثل البرمجة أو الرياضيات.
4. الصحافة والإعلام: في مجال الصحافة، يمكن استخدام النموذج لتوليد محتوى آلي مثل الأخبار أو المقالات. يمكن للنموذج تقديم مساعدة للمحررين في صياغة النصوص أو كتابة مقالات معقدة بناءً على موضوع معين.
لماذا لا يُستخدم Llama 3.1 في العراق بشكل كافٍ؟
رغم توفر Llama 3.1 كأداة مجانية، إلا أن هناك عدة تحديات تواجه استخدام هذه التكنولوجيا في العراق:
1. نقص الوعي: هناك قلة في التوعية بأهمية الذكاء الاصطناعي ونماذج اللغات الكبيرة. القليل من الأكاديميين والمطورين على دراية بإمكانيات هذه الأدوات وكيفية استخدامها في تطبيقات عملية.
2. ضعف البنية التحتية: البنية التحتية التقنية، وخاصة الإنترنت والموارد الحاسوبية، تشكل تحديًا كبيرًا في تنفيذ مشاريع تعتمد على الذكاء الاصطناعي بشكل فعال.
3. قلة المبادرات: لا توجد مبادرات محلية كافية تدعم تطوير مشاريع تعتمد على الذكاء الاصطناعي. قد تكون هناك حاجة إلى تعاون بين الجامعات، الشركات، والمؤسسات الحكومية لتمكين استخدام هذه التكنولوجيا.
دعوة للمشاركة في ورشة عمل
من هنا، أوجه دعوة للمطورين والأكاديميين والشباب المهتمين بمجال الذكاء الاصطناعي للانضمام إلى ورشة عمل سننظمها في كليتنا عن (استكشاف أدوات وتطبيقات الذكاء الاصطناعي الاستثنائية الأكثر استخداما) في تاريخ 11-13/11/2024. ستكون الورشة فرصة للتعلم العملي وتبادل الأفكار حول كيفية تخصيص النموذج لتلبية احتياجاتنا. رابط التسجيل على الورشة:
المصادر
https://teaminnovatics.com/blogs/large-language-models-llms-overview/
https://waverleysoftware.com/blog/how-integrate-chat-gpt-for-business/
https://www.linkedin.com/pulse/chatbots-natural-language-search-2-sides-same-coin-debmalya-biswas/
https://viso.ai/deep-learning/llama-2/