محرك الإدريسي

مقدمة:

 

ظهرت في الفترة السابقة الكثير من محركات البحث الداعمة للغة العربية. ويرجع سبب التأخر في ظهور هذه المحركات أو في تأخر دعم محركات البحث المشهورة للغة العربية إلى طبيعة اللغة العربية. إذ تحتاج هذه اللغة إلى تقنيات معقدة نظرا لأنها لغة صرفية و ليست لصقية مثل الإنجليزية. و قد انقسمت المحركات التي دعمت اللغة العربية إلى قسمين رئيسيين هما:

 

1- مجموعة قلدت محركات البحث الداعمة للغة الأنجليزية بحيث تقوم بالبحث على طريقة التطابق الحرفي. هذي المجموعة أدت إلى نتائج ضعيفة جدا في لكونها تخفي الكثير من النتائج أثناء البحث و التي قد تختلف عن كلمة البحث بزوائد حرفية بسيطة.

 

2- مجموعة اعتمدت على تقنيات متقدمة لمعالجة اللغة العربية منها اراب فيستا و الإدريسي. تتميز هذي المجموعة بالقدرة على البحث عن الكلمة باللواصق و اللواحق المختلفة مثل (ال- ب- ل- أ- و) و(هم- ان - ات...إلخ) بالإضافة إلى القدرة على البحث عن مشتقات الكلمة من الأسماء و الأفعال و الجموع سواء كانت بلواصق أو لم تكن.

 

محرك الإدريسي:

 

تم تطوير محرك البحث الأدريسي عن طريق شركة صخر لبرامج الحاسب الآلي. و هو محرك بحث يستطيع التعامل مع اللغة العربية بشكل أساسي بالإضافة إلى اللغات الأخرى كالإنجليزية و الفرنسية. و يتميز الأدريسي عن بقية محركات البحث في قدرته على التعامل مع اللغة العربية بشكل ممتاز متجاوزا أغلب الصعوبات التي تواجه محركات البحث الأخرى كالتشكيل و الصرف و القواعد النحوية. ذلك من خلال تقنية معالجة اللغة الطبيعية التي طورتها شركة صخر.

 

يدعم محرك البحث الإدريسي المستندات وقواعد بيانات الشركات ومواقع الإنترنت. و يوفر الإدريسي إمكانية عالية لاسترجاع المعلومات من قواعد البيانات و مواقع الإنترنت و يستعمل واجهه مستخدم بسيطة ثنائية اللغة. و يقدم الإدريسي خدمات بحثية تجمع ما بين القوة و البساطة و الدقة و السرعة. كما يمكن للمستخدم أن يكامل تطبيقاته بسهولة مع الإدريسي من خلال حزمة تطوير البرمجيات التي يوفرها الإدريسي. يدعم الإدريسي فهرسة قواعد البيانات ونشرها والبحث فيها بغض النظر عن تنسيقها و نظام تشغيلها الأصلي وذلك من خلال التكامل مع مشغلات .

.ODBC

 

يتمتع محرك البحث الإدريسي بمزايا عدة من أهمها:

 

1- يدعم الإدريسي فهرسة و بحث المستندات من أنظمة تشغيل مختلفة أو لغات مختلفة.

2- متوافق مع نظم أمان ويندوز إن تي مع التحكم في الوصول للبيانات.

3- محرك بحث ثنائي اللغة يدعم خصائص كل من اللغتين العربية و الإنجليزية.

4- يوفر قوالب بحث و نتائج قابلة للتخصيص. تغطي هذه القوالب جميع الخيارات التي قد يحتاجها المستخدم مثل عدد النتائج من البسيطة أو المركبة إلى التفصيلية المتقدمة.

 

سيناريو عملية البحث:

 

1- اكتب النص الذي تريد البحث عنه في مربع البحث.

2- حدد خياراتك العامة

3- حدد نوع البحث

4- اضغط زر البحث

 

 

يوفر الإدريسي 3 أنوع للبحث:

 

1- البحث عن جميع الكلمات: يجري فيه البحث عن الوثائق التي تحتوي على كل الكلمات التي نسجلها في صندوق البحث ولا يشترط أن تحتوي الوثائق على هذه الكلمات بنفس الترتيب المدخل أو أن تكون متلاحقة.

 

2- البحث عن جملة: يجري البحث عن الوثائق التي تحتوي على العبارة التي نسجلها في صندوق البحث بنفس ترتيب الكلمات و تلاحقها.

 

3- البحث عن أي من الكلمات: يجري البحث فيه عن الوثائق التي تحتوي على واحدة على الأقل من الكلمات التي نسجلها في صندوق البحث.

 

هناك خيارات عديدة لمستوى التطابق يقدمها محرك البحث الإدريسي و هي:

 

1- تطابق أو الكلمة كما هي: يجري البحث عن المستندات التي تحتوي على الكلمة المدخلة كما هي بالضبط.

 

2- لواصق: يجري البحث عن المستندات التي تحتوي على الكلمات المدخلة كما هي أو مع لواصقها سواء كانت سوابق أم لواحق.

 

3- مشتقات: يجري البحث عن المستندات التي تحتوي على الكلمات المدخلة كما هي أو مع مشتقاتها.

 

الإدريسي و قوقل:

 

من المعلوم بأن محرك البحث قوقل يعد من أشهر محركات البحث في العالم حتى أصبح كلمة قوقل فعلا تمت إضافته إلى قاموس اللغة الإنجليزية. على الرغم من ذلك فأن هذا المحرك لازال يعاني من بعض الصعوبات في معالجته للغة العربية مما يفقد المستخدم الكثير من نتائج البحث و الذي يؤدي في كثير من الأحيان إلى عدم حصوله على النتيجة المطلوبة. هذه المصاعب التي يواجهها مستخدمي قوقل من العرب تعود إلى عدم التفات قوقل إلى 3 أمور رئيسية و هي:

 

1- خصائص اللغة العربية و خصوصياتها: و من ذلك اللواصق الموجودة في اللغة العربية من السوابق و اللواحق. على عكس قوقل فإن الإدريسي اعتنى بهذه النقطة و بالتالي فإن النتائج التي لا تظهر في قوقل نتيجة لعدم الإنتباه لهذا الموضوع ستكون ظاهرة في محرك البحث الإدريسي.

 

2- عدم أخذ الأخطاء اللإملائية بعين الإعتبار: حيث أن الأخطاء الإملائية بشكل عام و المتعلقة بالهمزة بشكل خاص كثيرا ما تشكل مشكلة عند الشروع بالبحث. بينما قوقل لم تلتفت لهذه المشكلة فإن الإدريسي قد تلافاها من خلال المصحح الآلي و الذي يحلل النصوص المدخلة إملائيا.

 

3- اختلاف كتابة بعض الحروف بين البلدان العربية: فمثلا يكتب المصريون الياء بدون نقط أما في الدول الأخرى فإنها تكتب بنقط. عدم التنبه إلى هذه النقطة قد يؤدي إلى عدم عرض النتائج كالمة أثناء البحث و هو ما يحصل في قوقل.

 

الخلاصة:

 

بشكل عام فإن الإعتماد على التقنيات المستعملة مع اللغات الغير عربية لمعالجة اللغة العربية هو أمر غير مفيد. ذلك لأن اللغة العربية تتسم بخصائص و صفات خاصة بها فضلا عن أن بعض التفاصيل الدقيقة قد تختلف من بلد عربي إلى آخر و هو الأمر الذي يدعونا إلى العمل على تطوير تقنيات خاصة لمعالجة العربية بشكل خاص. بهذه الطريقة فإن عملية البحث المتعلقة بالعربية ستكون أدق مما هي عليه الأن و أكثر شمولية.

المراجع:

 

http://www.sakhr.com/Sakhr_a/Products/Idrisi.htm?Index=2&Main=Products&Sub=Idrisi

 

http://www.aswan.gov.eg/Search/Idresi.htm

 

http://www.pcmag-arabic.com/article.php?id=EEVlyVFyVZECIKERGM

 

http://www.pcmag-arabic.com/article.php?id=EEypAlAZZFblBHBbaX&page=10

 

 

المشاكل التي واجهتها:

 

1- عدم توفر محرك البحث على الأنترنت و بالتالي عدم القدرة على تجربة هذا المحرك و التحقق من عيوبه و مزاياة المختلفة.

 

2- عدم القدرة على الحصول على صور لواجهة هذا المحرك حتى يتم عرضها خلال المحاضرة.

 

 

الفوائد:

 

1- التعرف بشكل أوسع عن الأمور التي يجب الإنتباه إليها عند تصميم محرك بحث يدعم العربية.

 

2- معرفة الوضع الحالي لمحركات البحث التي تدعم العربية و مدى تقدم المبرمجين و شركات البرمجة العربية في هذا المجال.

 

3- القدرة على الحكم على أي محرك ما من خلال التركيز على عدد من المعايير والنقاط والتي تعرفت عليها من خلال بحثي في هذا المجال.

 

 

الأسئلة:

 

1- صح أم خطأ: تعتبر المحركات التي تعتمد على التطابق الحرفي هي الأفضل فيما يتعلق باللغة العربية؟

 

2- صح أم خطأ: التكامل مع التطبيقات التي يستعملها المستخدم هي إحدى ميزات الإدريسي؟

 

3- صح أم خطأ: بعكس قوقل، فإن الإدريسي قد التفت إلى مشكلة الأخطاء الإملائية المختصة بالهمزة؟