في الأربعة عقود الأخيرة زاد اهتمام
الباحثين بالمشاكل المتـعلقة في محاكاة الآلة للإنسان في عملية القراءة فبدأت
الأبحاث على محمل الجد لتطوير هذا النظام وجُمعت الأبحاث والنظريات فلوحظ الانجذاب
الهائل إلى هذا الموضوع بسبب طبيعة التحدي التي تمتاز بها المشاكل المصاحبة له, و بالرغم من ذلك حظيت اللغة الانكليزية حيزاً مهماً لدى الباحثين في
عملية التعرف على عكس اللغة العربية التي لم تلق اهتماماً كبيراً في هذا المجال
ربّما لأن اللغة العربية تتضمن الكثير من التحديات نظراً لكثرة خصائص اللغة العربية
, واختلاف شكل الكتابة اليدوية من شخص إلى آخر .
لذلك كان التوجه والهدف من هذه الأطروحة هو توفير وسيلة أفضل للتعرف على الأحرف و الكلمات العربية المكتوبة بخط اليد و تحويلها إلى شكل قابل للتحرير كما لو تم كتابته من خلال لوحة المفاتيح , فقمنا بتطوير برنامج للتعرف على الأحرف العربية المكتوبة بخط اليد HACR (Handwritten Arabic Character Recognition)، وهو برنامج لإدخال صورة لأحرف وكلمات عربية لينتج منها، الأحرف نفسها ضمن ملف نصي يمكن تعديله من نمط(TXT-DOC…).
لذلك كان التوجه والهدف من هذه الأطروحة هو توفير وسيلة أفضل للتعرف على الأحرف و الكلمات العربية المكتوبة بخط اليد و تحويلها إلى شكل قابل للتحرير كما لو تم كتابته من خلال لوحة المفاتيح , فقمنا بتطوير برنامج للتعرف على الأحرف العربية المكتوبة بخط اليد HACR (Handwritten Arabic Character Recognition)، وهو برنامج لإدخال صورة لأحرف وكلمات عربية لينتج منها، الأحرف نفسها ضمن ملف نصي يمكن تعديله من نمط(TXT-DOC…).
حيث يتم إدخال
الصورة ليتم تحويلها إلى مصفوفة ثنائية(binary image) و تهيئتها
بشكل مناسب لتدخل بعدها مرحلة التقسيم (segmentation) , تنتهي عملية
التقسيم عندما نحصل على مجموعة مصفوفات، كل مصفوفة تمثل صورة لأحد الحروف الموجودة
بصورة الدخل، بعد أن أصبح كل حرف منفصلاً بصورة خاصة به نتيجة عملية
التقطيع ,وأصبح بالإمكان استخلاص خصائص((Feature
extraction لكل حرف على حدة وتخزينها في
مصفوفة أشعة ,يتم تصنيفها حسب الخصائص المستخرجة في عملية تدعى التصنيف(Classification )، وبعد التعرف على الحرف المطلوب يتم كتابته على ملف نصي قابل
للتعديل.
وسوف نستخدم لغة MATLAB لحل هذه المشكلة المطروحة .