English
تسجيل الدخول | 
 الأولى
 
imag تخطي ارتباطات التنقل
الأخبار
الرأي
تحقيقات
حوارات
الطلابية
المتخصصة
الأخيرة

أخر عدد
 
 
 
كاريكاتير وصور
 

 

التقنية والتعرف على اللغة العربية


  يتصدى الباحثون في دول العالم المختلفة للمسائل التي تمكن من إيجاد الوسائل المناسبة التي تساهم في تقدم الأمم، ومنها التعرف آلياً على اللغات. فكم هو رائع أن تضع كتاباً أمام آلة تقوم بقراءته لكفيف يجلس بجانبها، وكم هو مناسب لأن يتحدث هذا الكفيف أمام الآلة لتقوم بكتابة كل ما يقوله، وبالتالي إعداد التقرير الذي يرغب بإعداده. أليس كل منا في مجال عمله يتمنى بأن تمكنه التقنية من أن يتكلم كلمة أو جملة واحدة فقط ليرى أن كلمته تترجم إلى عمليات تنفيذية وبدقة عالية: - إعطاء التعليمات للحاسب بدلاً من طباعتها بواسطة لوحة الملامس، - أن يقوم الطبيب بذكر اسم الدواء وتتولى الآلة إعداد الوصفة، وتدوين ذلك في ملف المريض، - قراءة الشيك في بنك ما من قبل الآلة والقيام بصرفه آلياً،... وهكذا نرى بأن الأمثلة لا حصر لها حيث إن التعرف على اللغة من قبل الآلة يمكن الإنسان من تسخير التقنية لتقوم بكل ما يريده منها وبدقة وسرعة عاليتين، مما يساهم بحق بارتقاء الأمم في سلم التطور والتقدم الحضاري. كل ذلك وغيره من آليات تطور الأمم وتقدمها ينضوي تحت لواء العمل بأول كلمة أنزلها الله على نبيه محمد صلى الله عليه وسلم «اقرأ». وستبقى هذه الكلمة هي السر في التطور مازالت الأجيال تتعاقب على الأرض حيث ستمكن من الوصول للاكتشافات الواحدة تلو الأخرى في المجالات المختلفة. وما الموضوع الذي نحن بصدده (التعرف على الحروف العربية) إلا هو واحد من هذه المجالات.
كيف تتمكن الآلة من التعرف على النص؟
تمر مرحلة التعرف على النص بعدة مراحل:
* مرحلة الإدخال، وتتمحور حول إدخال النص المراد التعرف عليه إلى جهاز التعرف (وليكن الحاسب) بواسطة أداة إدخال (وليكن ماسح ضوئي مثلا).
   ولعل هنالك من يشير إلى أنه يمكننا بكل بساطة إدخال النص إلى الحاسب بواسطة الماسح الضوئي، والتعامل معه، فماذا يعني التعرف؟ النص المدخل بواسطة الماسح إن لم تتم معالجته فهو عبارة عن صورة فقط ولا يمكن الاستفادة في التطبيقات المشار إليها أعلاه إلا بعد التعرف على كل كلمة على حده في هذه الصورة.
* مرحلة التعرف حيث يقوم جهاز التعرف بالتعرف على النص الذي تم إدخاله. وهنا يتم تجزئة النص إلى مجموعة الكلمات والأرقام والرموز المكونة له، ومن ثم تجزئة كل كلمة إلى الحروف المكونة لهذه الكلمة، وبما يمكن من إنجاز عملية استخلاص الحروف، وهنا لابد من أخذ خصائص اللغة بعين الاعتبار، فمثلاً تتميز اللغة العربية بأن معظم الحروف متصلة مع بعضها البعض (على خلاف اللغات اللاتينية حيث الحروف في النصوص المطبوعة منفصلة)، كما أن شكل الحرف باللغة العربية مرتبط بموقعه في الكلمة في حالات عديدة (مثلاً الحرف «ع» له الأشكال التالية: عـ - في بداية الكلمة، ـعـ - في الوسط، ع - في النهاية ويؤدي هذا إلى زيادة عدد أشكال الحروف المطلوب التعرف عليها. تتألف عملية التعرف من مرحلتين أساسيتين:
* استخلاص الخواصFeatures Extraction، حيث يتم وصف كل حرف بجملة من الخواص التي تشكل الدخل للمرحلة التالية.
* التصنيف Classificatio ، حيث يتم التعرف على الحرف باستخدام طرق متعددة: طريقة التطابق (Template Matching)، طرق إحصائية Statistical، طرق نحوية(Syntactic) وبنيوية Structural..
ليكن النص المراد التعرف عليه «رسول الهدى والرحمة» : الجدول التالي يبين كيفية تجزئة صورة هذا النص إلى كلمات ثم حروف ومن ثم التعرف.
المسألة التي تشغل الباحثين وتوليها مراكز البحوث في الجامعات وغيرها أهمية خاصة في هذه الأيام هي نسبة التعرف، حيث الهدف هو الوصول إلى أنظمة تعرف بوثوقية عالية جداً، ومازال مجال التعرف على النصوص العربية يشكل للباحثين تحدياً بسبب الطبيعة المتصلة للكتابة العربية وتعدد أشكال حروفها.

د.فريال حسن
قسم تقنية المعلومات

 
 
  imag