عربيتنا في عصر الذكاء الاصطناعي

د. صبري الشبول/ أكاديمي وباحث أردني
د. سهيل الحباشنة/ أكاديمي وباحث أردني
منذ فجر التاريح والإنسان يسعى للتعبير عن ذاته بأدوات وطرق متباينة، وقد احتلت اللغة مكانة رفيعة كأداة للتعبير والتواصل. ومع انبثاق حضارات وأفول أخرى؛ فإنَّ حركة البندول اللغوي قد حملت في طياتها صعوداً للغات وانحساراً لأخرى. ولطالما سعت الأمم لفرض لغتها أو الترويج لها كجزء من هُويتها. ولا تشكل اللغة العربية استثناءً على هذا الصعيد حيث مرت بمراحل مدٍّ وجزرٍ من حيث شيوعها وانتشارها. والناظر في تاريخ اللغة العربية كوعاء للمعرفة الإنسانية يجد أنَّها مرت بفترة ذهبية مع نزول القرآن الكريم بصفته كتاب سماوي أعاد تنظيم اللغة بحيث أصبحت اللغة المعيارية، والوعاء الذي يتميز بقدرته على التفاعل مع الفكر الإنساني بعيداً عن الحدود الجغرافية والفكرية. ومما أفاد اللغة العربية ذاك الترابط العضوي بينها وبين الدين؛ سيّما وأنَّ القرآن الكريم ككتاب سماوي نزل بلسان عربي مبين غير ذي عوج؛ مما استدعى أن تكون اللغة العربية جواز السفر الوحيد للقراءة التعبدية للقرآن الكريم. وهذه العلاقة التلازمية لا توجد بين أي ديانة ولغة أخريين. كما أكّد استمرارية هذا الترابط ذاك التعهد الإلهي بحفظ القرآن؛ مما يعني بالضرورة حفظ اللغة العربية مصداقاً لقوله تعإلى: "إِنَّا نَحْنُ نَزَّلْنَا الذِّكْرَ وَإِنَّا لَهُ لَحَافِظُونَ".
إنَّ اتكاءنا على هذا العهد الإلهي بالتكفل بحفظ اللغة العربية لا يعني بالضرورة التخلي عن حمل المسؤولية تجاه لغتنا، وقد ثبت ذلك عبر العصور منذ فجر الإسلام حيث شهد التاريخ بتلازمية مدى انتشار العربية بنبوغ وإبداع أبنائها؛ بحيث ارتبطت رفعتها برفعتهم وانحسارها بانكفائهم. وتجنباً للدخول في سجال ذي طابع تاريخي محض؛ فإنَّه حري بنا النظر في واقع اللغة العربية من حيث ستوى حضورها مقارنة باللغات العالمية الأخرى. تحتل اللغة العربية مرتبة مرموقة بين أول خمس لغات عالمية معترف بها في الأمم المتحدة. والسؤال المطروح في هذا السياق هو: ما هي المكانة التي باتت تتمتع بها اللغة العربية في عالم ذابت فيه الأيدولوجيا لصالح التكنولوجيا التي أصبحت تشكّل القوة المسيطرة في إعادة تشكيل العالم من جديد؟.
وبالرغم من أنَّ اللغة العربية هي اللغة الأولى لأكثر من 450 مليون شخص واللغة الثانية (أو الأجنبية) لأكثر من مليار شخص حول العالم، كما أنَّها تحتل المرتبة الخامسة بين سائر لغات العالم بعد المندرين الصينية والهندية والاسبانية والانجليزية على الترتيب، إلا أنَّها ما زالت غير قادرة على أخذ دور أكبر في مجال الذكاء الاصطناعي، والمشكلة لا تكمن في قصور المحتوى العربي، بل تكمن في مستوى الجهود المبذولة لإحلالها في فضاء البيانات المطلوبة لبرامج الذكاء الاصطناعي.
لقد كان لموقع "موضوع" على الشبكة العنكبوتية والذي أُطلق عام 2012 الدور الأكبر عربياً في حضور المحتوى العربي بشكل ملحوظ لدرجة أنَّه قد وضع الأردن في مقدمة الدول العربية في الإسهام في تعزيز المحتوى العربي على الشبكة العنكبوتية. إلا إنَّ هذه التجربة لم تعد كافية لجعل المحتوى العربي منافساً مقارنة باللغات الأخرى؛ وذلك لعدة أسباب: منها أنَّ هذا المحتوى يقتصر فقط على إتاحة المحتوى العربي على مستوى البحث عن المعلومة ومعرفة موقعها وتصنيفها والمحتوى المشابه لها في الشبكة العنكبوتية. وهذا بدوره قد لا يساعد على تكثيف تواجد المحتوى العربي للولوج لعالم الذكاء الاصطناعي.
في ظلِّ هذه المعطيات؛ لا بدَّ من الإشارة إلى ضرورة التحوّل في واقع اللغة العربية بطريقة تسهم في تواجدها في عالم الذكاء الاصطناعي والنمذجة اللغوية. هناك العديد من الدراسات التي أُجريت لمعرفة السلوك اللغوي لدى الناطقين باللغة العربية وعلاقته بمستوى معرفة سلوك العصبونات الدماغية وقدرتها على تفعيل النظام الإعرابي والبنيوي في إنتاج اللغة واكتسابها على حد سواء.
لقد تمكن الباحثون من معرفة كيفية انتظام النموذج الصرفي في آلية محددة تتعامل مع الصيغ المنتظمة وغير المنتظمة في التمثلات الدماغية المتباينة. لقد أثبتت هذه الدراسات وبشكل واضح أنَّ اللغة العربية تتسم بالقدرة على اتباع سلوك مغاير للغات الهندوأوروبية من توافر الصيغ الصرفية وإتاحتها لتشكل نموذجاً متسقاً من حيث التشابه وإمكانية إيجاد أنظمة صرفية بديلة لتلك التي توصل إليها الباحثون في الشأن اللساني الغربي.
تبدو أهمية مثل هذه الدراسات واضحة في ظلِّ توجه حكومة "أبو ظبي" لإطلاق نموذج الذكاء الاصطناعي (JAIS) ثنائي اللغة بين اللغتين العربية والإنجليزية والذي يتميز بدقته الفائقة مقارنةً ببقية الأنظمة. ويتميز "نظام جيس " بقدرته على التعرف إلى التفاصيل اللغوية للهجات العربية المختلفة، وفهم اللغة والسياق والإشارات الثقافية؛ مما يجعل هذا النظام أكثر دقة وارتباطاً سياقياً بالمقارنة مع النماذج الأخرى. لقد دُرب "برنامج جيس" باستخدام ذخيرة كبيرة من البيانات على برنامج "جالاكسي كوندور" (Condor Galaxy) والذي يتميز بأنَّه "أكبر حاسوب ذكاء اصطناعي في العالم". في أثناء عملية التدريب اُستخدم 116 مليار رمز من الذخائر من اللغة العربية، و279 مليار رمز من اللغة الإنجليزية.
بالرغم من قدرة هذا النظام على التوسع وبشكل ينسجم مع البنية الخوارزمية للنظام الذكي، إلا أنَّه ما زالت هناك بعض التحديات التي تقلّل من فرص منافسة اللغة العربية مع غيرها من اللغات الأخرى. تتمثل هذه التحديات بعدم وجود معجم عربي موحد ينظم التباين الدلالي والثقافي المرتبط بالسياق الاجتماعي لاستعمال اللهجات العربية. تظهر هذه المشكلة جلياً في ظلِّ التباين اللهجي بين المناطق اللغوية في المنطقة العربية والتفاوت –إن جاز التعبير- بين اللغة الفصيحة الحاضنة واللهجة الملازمة لها في السياق اللغوي والجغرافي. يمكن تجاوز مثل هذه التحديات على مستويين رئيسيين: أولهما هو توحيد المصطلح العربي بشكل معياري بحيث يتجاوز هذا المصطلح تأثير البعد المفروض من قبل اللهجات وقدرتها على تفسير المفردات الاصطلاحية مقارنةً بقدرة تلك المصطلحات على التعايش مع أي لفظة جديدة مأخوذة من لغات أخرى. إنَّ مثل هذه الإجراءات في توحيد المصطلح العربي تجعل من السهل تشكيل ذخائر لغوية قادرة على الدخول كبيانات في برمجيات الذكاء الاصطناعي. وأمَّا التحدي الآخر فيتجلّى في عدم قدرة خوارزميات هذا النظام على الاستجابة لعملية "التجذير" (Stemming). تتصف اللغة العربية بامتلاكها نظاماً اشتقاقياً غنياً يعزّز النمط الإعرابي فيها ويجعله يمتلك نظاماً صرفياً يؤدي الأغراض اللغوية كافة بسهولة ويسر. هذا النظام الاشتقاقي يؤثر على العلاقة بين المفردات ونظيراتها سواءً أكانت أفعالاً أو أسماءً او أية أنماط أخرى. وهذا بدوره يؤثر على قدرة الخوارزميات الحاسوبية على التنبؤ بشكل منتظم بالنمط الإعرابي أو البنائي للكلمة. طبعاً هذا لا ينفي عدم قدرة النظام اللغوي للغة العربية على الاستجابة لمنظومات الذكاء الاصطناعي؛ سيّما وأنَّ كثيراً من اللغات المشابهة لها قد احتلت مكانة غير مسبوقة في تلك المنظومات الذكية. وأخيراً؛ فإنَّه لا بدَّ من توحيد مجامع اللغة العربية في الدول الناطقة باللغة العربية كافة. تتجلّى أهمية مثل هذه الخطوة في توحيد المحتوى العربي المتعلق بتأصيل المفردات المقترضة من اللغات الأخرى وضمان سيولة مثل هذه المفردات ضمن إطار لغوي منتظم على المستويين اللغوي والتربوي. فضلاً عن ذلك؛ فإنَّ عملية توحيد المجامع العربية تسهم بدورها في ضمان توحيد عمليات التخطيط اللغوي بأشكاله كافة؛ وخصوصاً تلك المتعلقة بتنظيم معيارية الألفاظ اللغوية بين الناطقين باللغة العربية كافة، وتقعيدها بشكل بتناسب مع المحتوى الإعلامي والأكاديمي والسياسي...؛ بتوحيد مدخلات اللغة من أجل التعامل مع الخوارزميات المناسبة لذلك.
وكخلاصة؛ فإنَّ الجهود المبذولة في خدمة اللغة العربية لم تعد كافية للنظر إليها على أنَّها لغة مبنية على أرضية أيديولوجية فقط، بل يجب أن ينظر إليها على أنَّها لغة مبنية على بعد تكنولوجي أيضاً. في ظلِّ هذا المفهوم الثنائي، يسهل علينا العمل بشكل مكثف على صنع ذخائر لغوية ملائمة لعصر الخوارزميات الرقمية من أجل مستقبل واضح وعملي للتخطيط السليم.