MIME-Version: 1.0 Content-Type: multipart/related; boundary="----=_NextPart_01C885F6.E673B1D0" This document is a Single File Web Page, also known as a Web Archive file. If you are seeing this message, your browser or editor doesn't support Web Archive files. Please download a browser that supports Web Archive, such as Windows® Internet Explorer®. ------=_NextPart_01C885F6.E673B1D0 Content-Location: file:///C:/9E835651/ACStLect11.htm Content-Transfer-Encoding: quoted-printable Content-Type: text/html; charset="us-ascii"
=
1575;لتعرف
على الخط
العربي
المكتوب
يدوياً
جامعة
الملك فهد
للبترول و
المعادن
كلية
هندسة و علوم
الحاسب الآل=
10;
قسم
علوم الحاسب
الآلي
تعريب
الحاسبات
ع.ح 484
=
5;تطلب
9
&q=
uot;مواد
محاضرتي"
=
3;مل
فريق:
=
1606;حو
القمم
=
8;عار
الفريق:
<=
/span>
=
1;عضاء
الفريق:
=
1;حمد
سلام الرفاع=
10;
20860=
2
=
6;إشراف
=
5;لاستاذ
حسني المحتس=
76;
الثلاثاء=
207;،
19 كانون
الأول، 2006
المطلوب=
متطلب رقم 9: مواد محاضرتي
&nb=
sp;بعد
تقديم
محاضرتك
مباشرة نتوق=
93;
منك تسليم ما
يلي في هذا
المتطلب:
ü =
ملخص
المحاضرة
ü =
المرا=
80;ع
المستخدمة
ü =
المشا=
03;ل
التي واجهتك
ü =
الفوا=
74;د
التي استفدت
منها خلال
إعداد وتقدي=
05;
المحاضرة
ü =
3 أسئلة
من نوع
"اختيار من
متعدد" أو "ص=
1;
أم خطأ" حول
أهم المفاهي=
05;
التي قدمت في
محاضرتك
ملخ&=
#1589;
المحاضرة
<=
span
style=3D'mso-bookmark:OLE_LINK36'>التعرف
على الخط
العربي
المكتوب
يدوياً
التعرف
الآلي على
النصوص في
الصور
الممسوحة يم=
03;ننا
من البحث عن
الكلمات في
ملفات ضخمة. ب=
1575;لإضافة
إلى إمكانية
ترتيب
الرسائل
البريدية، و=
78;نسق
النصوص
القديمة
بطريقة أسهل.
إن مجال
التعرف على
الكلام
المكتوب
يدوياً فيه
الكثير من
التحديات
التي تُطرق
إليها في
السنوات
القليلة
الماضية بشك=
04; أكبر.
أن =
8;اع
التعرف
نظم
التعرف ممكن
أن تكون
متزامنة (o=
n-line) أو
غير متزامنة (=
span>off-line).
على سبيل
المثال تكون
متزامنة
عندما يقوم ا=
604;انسان
بكتابة
السلسلة
الحرفية
بالقلم على ا=
604;ـ
PDA=
(المساعد
الشخصي
الرقمي)،
وأيضاً تكون
غير متزامنة
عندما تعرض
على نصوص
مكتوبة سابق=
75;
مثل صور
ممسوحة
بالماسح
الضوئي. مما
لا شك فيه، أن
التعرف
المتزامن
أسهل من غير
المتزامن
نظراً لأنه
عندنا
معلومات أكب=
85;.
(يعني نحلل
حرف حرف بشكل
مباشر يكون
التركيز أكب=
85;
على ما يكتب
الآن
والشوائب
أقل).
التعرف
غير
المتزامن على
الكتابة الي=
83;وية
تتضمن تحديد =
605;اهي
الحروف أو
الكلمات
الموجودة في
صورة رقمية م=
606;
الكلام
المكتوب. إن
لها فائدة
عظيمة في
التواصل بين
الإنسان وال=
70;لة
و تساعد في
معالجة
النصوص
الكتوبة
يدوياً.
ال=
3;افع
العربية
يتحدثها 234
مليون شخص وه=
610;
ثقافة مهمة
لأعداد أكبر
من الناس. حيث
إن الكلام
العربي يختل=
01;
ولكن الكتاب=
77;
العربية
موحدة
في مختلف
أنحاء العال=
05;
العربي و تسم=
609;
وفقاً للمعي=
75;ر
العربي
الحديث Modern St=
andard
Arabic.
كما أن العدي=
583;
من اللغات
الأخرى
تستخدم الحر=
08;ف
العربية مثل
الفارسية
والكردية
والأردية. لذ=
575;
فإن القدرة
على تفسير
الكلام
العربي المك=
78;وب
آلياً له
فوائد واسعة.
يمكننا
أيضاً على
التعرف على
الكتابات
العربية
القديمة،
بنفس طريقة
التعرف على
اللغة الحدي=
79;ة
يمكننا أيضا=
11;
التعرف على
اللغة القدي=
05;ة.
المعالجة
الآلية
تمكننا من
زيادة جعل هذ=
607;
المصادر
متوفرة.
خص=
5;ئص
اللغة
العربية
اللغة
العربية
تتألف من 28 حرف=
اً.
كل حرف له
شكلان أو
أربعة أشكال=
48;
واختيار شكل
الحرف يكون
على حسب موقع=
577;
في المقطع.
أربعة مواقع
محتملة،
بداية
المقطع، وسط
المقطع،
نهاية المقط=
93;
أو معزول. الح=
1585;وف
التي لا يمكن
أن تكون في
بداية المقط=
93; أو
وسطه
لايمكنها
الاتصال مع
الحرف الذ ي
يليه. الحروف
مبينة في
الشكل التال=
10;.
<=
span
lang=3DAR-SA>
شك =
4; 1:
الحروف
العربية و
شكلها على حس=
576;
موقعها.
كما
تتميز اللغة
العربية
بوجود
الحركات وهي
عبارة عن مدو=
583;
قصيرة أو
تنوين أو
تشديد الحرف. =
1593;ادة
هذه الحروف ل=
575;
تكتب أثناء
الكتابة.الح=
85;كات
هي: الفتحة و
الضمة
والكسرة
والتنوين
والشدة
والهمزة
والمدة.بعض
الحركات
مبينة بالشك=
04;
التالي:
<=
!--[if gte vml 1]>
شك =
4; 2:
تنوين الفتح=
48;
السكون،
الكسرة،
الضمة، الفت=
81;ة
كما أن
بعض الحروف
لها سوابق أو
لواحق (descender ) أو=
(ascenders)<=
span
dir=3DRTL>،
كما هو مبين
في الشكل
التالي
السوابق هي م=
575;
فوق أعلى سطر=
548;
واللواحق، ه=
10;
ما تحت السطر
الأسفل.
<=
/span>
شك =
4; 3:
السوابق
واللواحق
تكتب
اللغة
العربية من
اليمين إلى
اليسار، وال=
81;روف
عادة ماتكون
متصلة حتى عن=
583;
الطباعة. يعت=
605;د
توصيل الحرف
على الحرف عل=
609;
الحرف الذي ي=
604;يه.
السطر
الأساسي (b=
aseline) هو
السطر الذي
عادة ما تتصل
الحروف عن
بعضها. في
الواقع قريب
منه.
لا يوجد
اتصال بين
الكلمات، لذ=
75;
يجب أن نضع فر=
1575;غ.
هناك ست حروف
لا تتصل إلا
من اتجاه
واحد. لما
يظهروا في
كلمة ما تنقس=
605;
الكلمة إلى
عدد من المقا=
591;ع.
الرباط=
Ligature: هو
تكوين الحرف
باتصال حرف أ=
608;
أكثر بشكل
مقبول مثل
اللام ألف (لا)
أو يا ميم،
لام ميم،
وغيرها. الاش=
603;ال
المختلفة
لحرف لا مبين=
577;
بالشكل التا=
04;ي.
<=
/span>
حرف لا
وطرق كتابته
يدوياً.
ال=
8;عرف
على الكتابة
اليدوية –
طريقة العمل
للتعرف
على الكتابة
العربية يجب
أن نمر بعدد م=
1606;
المراحل،
أولاً مرحلة
ما قبل المعا=
604;جة،
ثم مرحلة
التمثيل. إن
هنالك
طريقتان للت=
93;رف
الطريقة
الكلية، بحي=
79;
نتعرف على
الكلمة بشكل
كامل، ولا
يوجد حاجة إل=
609;
التقطيع،
والطريقة
الثانية هي
طريقة هي
التعرف على
أجزاء من
الكلمة
كالأحرف
وغيرها، وفي
هذه الحالة ن=
581;تاج
لمرحلة
التقطيع. بعد
ذلك نحتاج إل=
609;
مرحلة
استخلاص الخ=
89;ائص
للكلمات أو
الوحدات
الأصغر، ثم
مرحلة
المتعرف،
وسوف يتم شرح
ما يجري بكل
مرحلة فيما
يلي. الشكل
التالي يوضح
الشكل العام
للتعرف على
الكلام
المكتوب
يدوياً.
شك =
4; 4:
المخطط العا=
05; للتعرف
على الكتابة
اليدوية
قبل
المعالجة
تتم قبل
المعالجة
العمليات
التالية: الت=
593;رف
على الخط
الأساسي، عم=
04;ية
إزالة
الشوائب،
وتصحيح
الميلان عن
طريق معالجة
الصور،
وتحديد مكان
النص في
الصورة، وفص=
04;
النص عن ما
يحيطه
التمثي=
04;
الصورة
عادة ما تتحو=
604;
إلى شكل موجز
قبل التعرف،
وهناك شكلان
عادة ما يمثل
الشكل بهما: الهيك=
ل
skeleton هو عبارة
عن التعبير ع=
606;
الكلمة بسمك
نقرة ضوئية
(بكسل) واحدة
تظهر الخط
الوسطي للنص.
عملية
الهيكلة sk=
eletonization
<= /span>
شكل 5: طرق
التمثيل:
المحيط
(يمين)،
والهيكل
(وسط)،
والكلمة
الاصلية
(يسار).
التقطي=
93;
التقطيع=
(segmentation
<=
/span>
شكل 6: ظهو=
585;
الحرف التال=
10;
قبل السابق
(يمين) أو التا&=
#1604;ي
تحت السابق
(يسار).
لهذه
الاسباب قد
يعتقد
الكثيرون أن
اللغة العرب=
10;ة
أصعب للتعرف
عليها من
اللغة
الانكليزية.
ولكن هناك
اعتبارات
تجعل اللغة
العربية أسه=
04;
مثل: عدم وجود
حروف كبيرة
وصغيرة، وخط
أساسي قوي،
وقصر طول
الكلمة
بالمعدل، =
1606;قاطه
المميزة،
تغير شكل
الحرف على حس=
576;
موضعه
بشكل نظامي.
استخلا=
89;
الخصائص
الخصائص=
هي
عبارة عن
قياسات عددي=
77;
مأخوذة عن
الصور أو عن
مكان في الصو=
585;،
هذه القياسا=
78;
هي التي تمرر
للمتعرف لكي
يتعرف عليها
أمثلة
على الخصائص:
طرق
التعرف
التعرف
من الممكن أن
يكون مبني عل=
609;
القواعد أو م=
576;ني
على
الاحتمالات =
71;و
كليهما معاً.
ونستطيع أن
نبني هذا
المعالج باس=
78;خدام
بعض الطرق مث=
604;
الشبكات
العصبونية، =
75;نموذج
ماركوف
المخفي والق=
08;اعد
أو عن طريق هج=
1610;ن
بين الطرق
الاحصائية
والقواعد.
القواع=
83;: إنشاء
قواعد تعتمد
على الخصائص
البنيوية لل=
81;رف
مثل
المنحنيات
المفتوحة
بعدد من
الاتجاهات.
الشبكا=
78;
العصبونية<=
span
lang=3DAR-SA>: تتكون من
عنصر معالجي
بسيط و عدد
كبير جداً من
الترابط،
الأوزان في
العناصر تدر=
76;
من خلال بيان=
575;ت
تدريبية. وهي
مقسمة إلى
طبقة مدخلات=
48; و
طبقات متوسط=
77;
"مخفية" و
طبقة مخرجات
نهائية.
المعلومات
تذهب من خلال
البداية إلى
النهاية الت=
10;
تعطي الحرف
المطلوب.
الشكل التال=
10;
يري الشكل
العام
للشبكات الع=
89;بونية.
<=
/span>
شكل 7:
الشبكات
العصبونية
انموذج
ماركوف المخ=
01;ي (HMM) تعتبر
مناسبة لتعل=
05;
الخصائص الت=
10;
من الصعب وصف=
607;ا
بشكل بديهي.
متسلسلة
باتجاه واحد=
48;
فيها states حالات =
1608;
احتماليات propablitites
<=
/span>
شكل 8:
نموذج ماركو=
01;
المخفي.
الاستخداما=
78;
أثبت
التعرف على
الخط العربي
المكتوب
يدوياً
جدواه، في
التطبيقات
المحصورة مث=
04; التعرف
على الارقام
المكتوبة عل=
09;
الشيكات يدو=
10;اً،
كقاعدة
بيانات AHDB
التي تحتوي
على أرقام و
أكثر الكلما=
78;
استخداماً،
وكلمات
مكتوبة
يدوياً، وال=
78;عرف
على العنواي=
06;
البريدية، ك=
02;اعدة
بيانات تحوي
أسماء مدن
وأرقام
وكلمات تظهر
في العنواين.
الم&=
#1585;اجع
المستخدمة
Offline Arabic Handwriting Recognition: A Survey. By= Liana M. Lorigo, Venu Gvindaraju.
بالإضاف=
ة
مراجع أخرى م=
606;
الانترنت و
محاضرة
المادة عن ال=
578;عرف
الضوئي عن
الكتابة
العربية تمت
قراءتها
والاستفادة
منها بشكل غي=
585;
مباشر.
الم&=
#1588;اكل
التي واجهتن=
10;
الحصول
على الترجمة
الدقيقة.
فهم
المادة
العلمية
محاولة
الحصول على
عرض ليس عام
جداً يصلح لأ=
606;
يعرض لأناس
غير
اختصاصين،
وليس متخصص
جداً بحيث لا
يمكن أن يفهم=
607;
إلا من له باع
كبير في مجال
التعرف.
استخلاص
المعلومات
المهمة من
الأوراق الب=
81;ثية.
الحصول
على مراجع
سهلة الفهم،
من الممكن عر=
590;ها
على الطلاب
يستدعي وقتا=
11;
جيداً.
الف&=
#1608;ائد
التي
استفدتها من
المحاضرة
فتحت لي
الآفاق في
مجالات بحثي=
77;
جديدة.
تقدير
المحاضرة
الناجحة، لم=
75;
ورائها من
العمل الجاد.
التواصل
مع الآخرين
باستخدام
اللغة العرب=
10;ة،
كيف يتم ذلك؟
لأن المراجع
باللغة
الانكليزية=
8;
وخلفيات
المستمعين ق=
83;
تكون
بالانكليزي=
7;،
فتحتاج إلى
إظهار
المصطلح
العربي الدق=
10;ق
إلى جانب
المصطلح
الانكليزي.
الثقة
بالنفس
والقدرة على
الانجاز.
ثلا&=
#1579;
أسئلة
مشاكل ال=
;تمثيل
بالمحيط هي
التحديد بشك=
04;
خاطئ
للخصائص،
والالتباس ا=
04;خاص
بكل خوارزمي=
77;
تنحيف =
1571;ما
طريقة التمث=
10;ل
بالتنحيف
(الهيكلة)
تتجنب هذه
المشاكل
لأنها لا تخس=
585;
معلومات.
الإجابة:
طريقة
الشبكات
العصبونية ف=
10;
التعرف على
الخط العربي
المكتوب
يدوياً بحاج=
77;
إلى تدريب من
خلال بيانات
تدريبية حتى
تعطي نتيجة ص=
581;يحة.الإجابة:
=
þ
من
الأمثلة
الناجحة على
استخدامات
التعرف على
الخط العربي
المكتوب
يدوياً هي
التعرف على
الأرقام و
الكتابات
المكتوبة عل=
09;
الشيكات.الإ=
80;ابة:
þ