استخراج الخصائص Feature extraction:
تقنية استخراج الخصائص المعتمدة على الميزات الشكلية
للمحارف والتعرف عليها [8] :
إن أنظمة
التعرف على الكلمة المقطعة تقوم باستخراج الخصائص للحرف بالاعتمادعلى علم الهندسة.
تستند هذه
الخصائص على الخط الأساسي الذي يشكل هيكل الحرف (skeleton).وتكون هذه
الخصائص ممثلة بأشعة قد ولدت من مجموعة التدريب واستخدمت بعد ذلك لتدريب التعرف
على النمط المعتمد على الشبكات العصبونية بحيث يمكن للنظام إجراء مقارنة معيارية.
:UNIVERSE OF DISCOURSE المحيط العام للصورة
يعرف كأصغر
مصفوفة تناسب هيكل الحرف بأكمله وقد اختير لأن الميزات المستخرجة من صورة الحرف مستقلة
عن حجم صورته الأصلية.
تقسم الصورة إلى
نوافذ متساوية الحجم ,استخراج الخصائص يطبق على النوافذ بدلاً من تطبيقه على كامل
الصورة ,وهذا يعطي المزيد من المعلومات التفصيلية لهيكل الحرف.
وبالمثل يمكن
اعتبار أمكنة مقاطع الخط المختلفة لهيكل الحرف خاصية إذا استعملنا التقسيم إلى
مناطق وهذا لأن مقطع خط محدد للحرف يظهر في منطقة محددة في معظم الحالات.
بداية يتم قراءة الصورة وتقسيمها
الى ثلاث مناطق عموديا وثلاث مناطق أفقيا بحيث كل قسم أو منطقة منها تسمى Zone وبالتالي نحصل من كل صورة على 9 مناطق
من كل منطقة يتم استخلاص الخصائص
اللازمة وهي :
1-
عدد
الخطوط الافقية
2- عدد
الخطوط العمودية
3-
عدد
الخطوط ذات الميل اليميني
4-
عدد
الخطوط ذات الميل اليساري
5-
القيمة
المقيسة لطول الخطوط الافقية
6-
القيمة
المقيسة لطول الخطوط العمودية
7-
القيمة
المقيسة لطول الخطوط ذات الميل اليميني
8-
القيمة
المقيسة لطول الخطوط ذات الميل اليساري
9-
نسبة
عدد البيكسلات للصورة الى عدد البيكسلات المنطقة
بما
ينتج بالمجمل 81 خصيصة تمثل المناطق التسعة .
مما
يلزم لاستخراج الخصائص السابقة تحديد الخطوط المشكلة للحرف ضمن كل منطقة أي تحديد
نقطة بداية ونهاية كل خط بالاضافة الى زاوية ميلان هذا الخط .
يلزم
لذلك تعريف المصطلحات التالية :
1-البادئات والتقاطعات والبادئات الثانوية
2- اجتياز الحرف