30 أغسطس (رويترز) – يقوم فريق من المهندسين والباحثين وشركة شرائح مقرها وادي السيليكون بإصدار برامج متقدمة باللغة العربية يمكنها بناء تطبيقات الذكاء الاصطناعي.
يحتوي نموذج لغة جديد واسع النطاق يسمى Jais على 13 مليار معلمة، تم إنتاجها من كتلة كبيرة من البيانات تجمع بين اللغتين العربية والإنجليزية، وجزء منها من كود الكمبيوتر. شرع الفريق، الذي يضم معلمين ومهندسين، في المشروع جزئيًا لأنهم قالوا إن هناك بعض النماذج اللغوية الرائعة في ثنائية اللغة.
وتم تطوير نموذج اللغة الجديد بمساعدة أجهزة الكمبيوتر العملاقة التي تصنعها شركة Cerebras Systems ومقرها وادي السيليكون، والتي تصمم شرائح بحجم طبق العشاء تتنافس مع أجهزة الذكاء الاصطناعي القوية من Nvidia. هناك نقص في رقائق Nvidia، مما دفع الشركات في جميع أنحاء العالم إلى البحث عن بدائل.
تم تسمية زايس على اسم أعلى قمة في دولة الإمارات العربية المتحدة، وهي موطن لـ Cerebras، وجامعة محمد بن زايد للذكاء الاصطناعي، وشركة Inception التابعة لشركة G42 ومقرها أبو ظبي، والتي تركز على الذكاء الاصطناعي.
نظرًا لعدم وجود بيانات عربية كافية لتدريب نموذج بحجم زايس، ساعد رمز الكمبيوتر الموجود على البيانات باللغة الإنجليزية في تدريب القدرة المنطقية للنموذج، كما يقول تيموثي بالدوين، أستاذ الذكاء الاصطناعي في جامعة محمد بن زايد.
وقال بالدوين لرويترز “(الكود) يمنح النموذج تقدما كبيرا فيما يتعلق بمهارات التفكير لأنه يوضح الخطوات (المنطقية)”.
Jayce متاح من خلال ترخيص مفتوح المصدر.
قام الفريق بتدريب نموذج زايس على الكمبيوتر العملاق الخاص بشركة Cerebras والمسمى Condor Galaxy. أعلنت Cerebras هذا العام أنها باعت ثلاث وحدات من هذا القبيل إلى G42، ومن المقرر أن تصل الأولى هذا العام وسيتم تسليم الوحدات المتبقية في عام 2024.
ماكس أ. في سان فرانسيسكو. تقرير تشيرني؛ تحرير جوزي جاو
معاييرنا: مبادئ الثقة في طومسون رويترز.
“مخضرم وسائل الإعلام الاجتماعية. هواة الطعام. رائد ثقافة البوب. النينجا التليفزيوني.”
More Stories
الانتقام في الشرق الأوسط: هل إيران التالية بالنسبة لحزب الله؟
البرازيل تهدد بإيقاف القاضي X عن العمل خلال 24 ساعة
تعلن المؤسسة العربية الأمريكية عن المتحدثين والفنانين، تواصل مع أمريكا العربية: قمة التمكين 25-26 أكتوبر 2024