نشر أول مرة بتاريخ: 26/5/2023
شهد العقدان الأخير من القرن العشرين والأول من القرن الواحد والعشرين، العصر الذهبي لتطوير البرمجيات المرتبطة باللغة العربية من قبل شركات عربية. ظهرت خلال تلك الفترة برمجيات النشر المكتبي، التدقيق الإملائي والنحوي، تحويل الكلام العربي المنطوق إلى نص وبالعكس، القارئ الآلي للحروف المصورة (OCR)، الإملاء الصوتي، محركات البحث، والترجمة من وإلى اللغة العربية. ورافق ذلك ظهور بوابات عربية كبيرة وواعدة على شبكة الإنترنت مثل، أربيا أون لاين (www.arabia.com)، والشبكة العربية (www.arab.net)، وعجيب (www.ajeeb.com)، وجميعها اختفى لاحقاً.
المدققات الإملائية والنحوية العربية
شهدت ثمانينات وتسعينات القرن الماضي تطوير وإطلاق العديد من المدققات الإملائية والنحوية العربية، كان أبرزها شركة أنظمة المعلومات العربية التي أسسها علاء الدين صلاح العجماوي عام 1982، والتي طورت مدققاً إملائياً لأجهزة الماكنتوش، وصخر لبرامج الحاسب التي أسسها محمد الشارخ عام 1982، والتي طورت مدققاً إملائياُ للأجهزة التي تعمل بنظام دوس ومن ثم ويندوز، وشركة كولتك المصرية التي أسستها الدكتورة تغريد السيد عنبر عام 1990 لتطوير التقنيات اللغوية العربية، وطورت مدققاً إملائياً لنظام ويندوز. لم تتمكن الشركات العربية المطورة لهذه التقنيات اللغوية من الوصول إلى الشركات العالمية الكبرى، باستثناء الأخيرة التي نجحت في بيع مدققها الإملائي العربي لمايكروسوفت عام 1997، حيث تم دمجه بطاقم أوفيس 97، ثم ألحقته بالمدقق النحوي للغة العربية ضمن طاقم أوفيس 2000. لكن يبدو أن مايكروسوفت توقفت عن التعامل مع شركة كولتك خلال العقد الثاني من القرن الواحد والعشرين. وأنشأت فريقها الخاص لمتابعة العمل على المدققين العربيين للإملاء والنحو.
أدخلت في محرك غوغل للبحث العنوان www.coltec.net فظهرت أمامي صفحة باللغة التايلاندية. العنوان الذي أدخلته كان يوماً ما موقع ويب لشركة كولتك المصرية. استخدمت موقع أرشيف الإنترنت (https://archive.org) الذي يوفر إمكانية البحث عن صفحات الويب التي لم تعد موجودة، فتبين لي أن موقع www.coltec.net أغلق نهائياً عام 2015.
محركات البحث العربية
طورت العديد من الشركات العربية محركات بحث لشبكة الإنترنت منها محرك “أين” الذي انطلق عام 1997 وأغلق عام 2012، و”العربي” الذي انطلق عام 2006 وأغلق عام 2009، و”أنكش” الذي انطلق عام 2007 وأغلق عام 2010. لكن جميعها لم يستطع منافسة محركات البحث العالمية خاصة محرك غوغل الذي انطلق عام 1998 وبدأ بدعم اللغة العربية عام 2002، ولذلك انتهى أمرها بالإغلاق. وطورت شركة صخر محرك بحث “الإدريسي” الذي استخدمته العديد من الشركات وبعض مواقع الويب. وعلى الرغم من جودة “الإدريسي” في معالجة اللغة العربية، لكنه لم ينتقل ليتحول إلى محرك بحث شامل للإنترنت، إذ لا تكفي جودة معالجة اللغة للنجاح في ذلك، فالبحث في الإنترنت يتطلب العديد من التقنيات الأخرى، كالزاحف (Crawler) الذي يجوب كافة صفحات الإنترنت التي يقدر عددها بالمليارات ويفهرسها ويتعرف على الفاسد منها ويتجنبه، ويتعرف على لغة كل صفحة، ويتعرف على حدود النصوص والمقالات ويستخرجها، ويتعرف على اسم المؤلف، ويتعرف على الصور وحدودها وعناوينها. ومن التقنيات الأخرى الأساسية التي يتطلبها محرك البحث، نذكر ترتيب نتائج البحث بأفضل ما يمكن، والذي يتضمن عشرات المتغيرات وهو ما جعل محرك بحث غوغل الأول عالمياً بعد فترة قصيرة من إطلاقه.
تطوير محرك بحث لشبكة إنترنت يتطلب استثمارات كبيرة. فغوغل مثلاً حصلت على تمويل قدره 25 مليون دولار بعد أقل من عام على إطلاقها، ثم حصلت في العام الذي يليه على 25 مليون دولار إضافية، وذلك عبر مستثمرين مغامرين من القطاع الخاص، وهذا للأسف غير متاح في البلدان العربية.
كان يفترض أن تدعم الجهات الحكومية العربية أحد محركات البحث العربية التي تم إنشاؤها وتساهم في تمويله بحيث ينمو ويتمكن من اقتطاع حصة جيدة من السوق المرتبط بالبحث عبر الإنترنت باللغة العربية على الأقل. ما كان لمحرك البحث الصيني بايدو (Baidu) الذي انطلق في 18 يناير/ 2000 أن يحقق النجاح الكبير الذي حققه لولا الدعم الحكومي وضخ ملايين الدولارات فيه. ويوجد في الصين حالياً أكثر من خمسة محركات بحث أخرى لشبكة الإنترنت. وينطبق الأمر على محرك البحث الروسي ياندكس (Yandex).
الترجمة من وإلى العربية
أطلقت شركة أي.تي.أي عام 2000 موقع المسبار (www.almisbar.com) لترجمة النصوص ومواقع الإنترنت من الإنجليزية إلى العربية. وفي العام ذاته أطلقت صخر موقعها للترجمة من الإنجليزية إلى العربية (www.Tarjim.com). وكان الموقعان واعدين، إلى أن أنهت غوغل العصر الذهبي لبرمجيات الترجمة العربية في شهر أبريل/نيسان عام 2005، بعد أن تفوقت ترجمة غوغل الإحصائية المطورة حديثاً على ترجمة صخر وبرامج ترجمة أخرى في الاختبارات التي أجراها المعهد الوطني الأمريكي للمعايير والتقنية (NIST).
وظفت غوغل الكم الهائل من المحتوى الذي جمعته عبر محرك البحث، لتطوير محرك الترجمة الاحصائي من الإنجليزية إلى العربية وبالعكس، وهو أمر كان متعذراً على الشركات العربية، لافتقارها لهذه الكم من المحتويات. تمكنت عدة شركات عالمية فيما بعد من تطوير محركات ترجمة من الإنجليزية إلى العربية وبالعكس منافسة على رأسها مايكروسوفت نظراً لامتلاكها قدراً من المحتويات مقارباً لما تملكه غوغل.
العولمة تلتهم التقنيات العربية المحلية
شهد العقد الثاني من القرن العشرين انتقال تطوير العديد من التقنيات اللغوية العربية واسعة الاستخدام من الشركات العربية إلى الشركات العالمية التي تبنت تطوير هذه التقنيات بنفسها مستعينة بخبراء عرب. ولم يقتصر الأمر على التقنيات التي سبق أن تناولناها، بل شمل التعرف على الصوت العربي والإملاء الصوتي الآلي، والقارئ الآلي للحروف المصورة، وتحويل الكلام العربي المنطوق إلى نص وبالعكس.
هل ما تزال الفرصة متاحة أمام البلدان العربية للعمل على تطوير تقنيات اللغة العربية؟
الإجابة نعم. في شهر سبتمبر/أيلول 2022، أطلق الاتحاد الأوروبي مشروع إنشاء محرك بحث أوروبي لشبكة الإنترنت (OpenWebSearch.eu). يتلخص السبب المعلن لهذا المشروع في المخاوف الناشئة عن اختلال التوازن في سوق محركات البحث الذي تهيمن عليه عدة شركات كغوغل ومايكروسوفت وبايدو وياندكس، وتتحكم بالتالي بمحتوى الإنترنت، ما يهدد ديموقراطية المحتوى ويحد من الإمكانيات الابتكارية الأوروبية. الحاجة إلى تطوير تقنيات اللغة العربية أكبر من الحاجة الأوروبية، لكن الأمر يتطلب إنشاء مركز عربي متخصص بذلك، تدعمه عدة بلدان عربية وخاصة الغنية منها، يستخدم الكم الهائل من المحتوى العربي المتوفر حالياً (المحتوى هو الملك)، لابتكار طرق جديدة وفعالة لمعالجة مسائل اللغة العربية المتشعبة بما في ذلك الموسيقى العربية وخطوط اللغة العربية.
عبد القادر الكاملي
مسار للأبحاث
الثلاثاء, 28 نوفمبر 2023
/
Published in
آراء |

You must be logged in to post a comment.