التقطيع Segmentation :
تعتبر من أهم العمليات على الصور لأن
الخطأ في عملية التقسيم يعني فشل في كل التطبيقات التي تعتمد عليها وبالتالي سوف
نفشل في التعرف على الحرف أو على الكلمة المطلوبة .
حيث في هذه المرحلة يتم التعرف على
مضمون الصورة وما تحتويه من أحرف وكلمات و ستقسم الكلمة إلى أجزاء لنتعرف على
الأحرف التي تتضمنها .
والأمر
ليس بالعملية السهلة وخاصة لأن الأحرف اللغة العربية خصائص وميزات قد تسبب التعقيد في هذه المرحلة،
فيجب الفصل بين الأحرف دون إضاعة أي نقطة أو جزء من الحرف أثناء التقطيع.
لتنفيذ
هذه العملية يتم الضغط على زر (التقطيع ).
خوارزمية التقطيع :
تمت عملية التقطيع على مرحلتين :
المرحلة الأولى: تقسيم الكلمة الى مقاطع باستخدام
خوارزمية التأشير(labeling)
مثال: كلمة باب تقسم إلى قسمين : الأول (با) , و القسم الثاني (ب) .
المرحلة الثانية: تقسيم المقطع المجزأ من الكلمة إلى
الأحرف المكونة منه باستخدام مركز الصورة
مثال: المقطع (با) يتم تقطيعه إلى حرفين .
في كلا المرحلتين تم استخدام تعليمة في الماتلاب هي : region prop التي تقوم بقياس عدة خصائص للمكونات المتعددة في
الصورة في الثنائية .
ففي المرحلة الأولى يتم تحديد
كل مكون , حيث المكون هو هو كل جزء يحمل اللون الأبيض (أي يحمل الرقم 1) من الصورة
الثنائية و أحيط من جوانبه باللون الأسود (أي يحمل الرقم 0 ) خرج هذه المرحلة
سيكون مدخل للمرحلة الثانية ليتم التقسيم بالاعتماد على خوارزمية مركز الصورة .
الشكل يوضح الخصائص المتعددة التي
تحسبها هذه التعليمة :
الخصائص لتعليمة region prop |
لتقسيم الكلمة إلى مقاطع تم
استخدام الخاصية boundingbox تقوم هذه الخاصية بتحديد المستطيل الأصغر حول
العنصر في الصورة الثنائية وهكذا نكون قد حددنا المساحة التي
يشغلها كل حرف مع نقاطه وزوائده دون ضياع أي معلومة لهذا الحرف، ثم تخزين الحرف
بمصفوفة , الشكل يوضح خاصية boundingbox.
توضيح تحديد المكون بأصغر مستطيل . |
و لتقسيم المقطع إلى أحرف تم
استخدام خاصية مركز الصورة الثنائية centroid التي تحدد مركز الكتلة في المنطقة , إحداثيات
هذا المركز (x,y) حيث أن تجمع البكسلات في مركز الحرف أكبر بكثير من تجمع البكسلات في مكان
اتصال الحرفين اعتماداً على هذا المبدأ يتم الفصل بين الأحرف .
بالتالي في
نهاية عملية التقطيع سيكون لدينا كل الأحرف
التي تكونت منها الكلمة المدخلة ولحفظ هذه الأحرف المقطعة يتم الضغط على زر (تخزين
الحروف في قاعدة البيانات ) والذي صمّم برمجياً ليقوم بحفظ الصورة في المكان
الذي نحن نختار, الشكل يوضح ذلك .
تخزين الصورة بعد كتابة الحرف . |