مصطلحات الأونطولوجيا في ويكيداتا

classic Classic list List threaded Threaded
1 message Options
Reply | Threaded
Open this post in threaded view
|

مصطلحات الأونطولوجيا في ويكيداتا

Ahmad Gharbeia
مرحبا يا ويكيبيديين،

نحن بحاجة ماسّة إلى جهد منظّم لمراجعة  المفردات الأونطولوجية العربية في
ويكيداتا. أقصد المفردات التي تعرّف دلالات المعاني و الموجودات و العلاقات
المعرفية بينها، مثل "instance" و "subclass of" و ما شابهها.

الواقع أنّي بنظرة عابرة وجدت خطأ جسيما في التعريب، و أتوقّع وجود غيره.

و بالنظر إلى أنّ ويكيداتا قسم من البنية التحتية المعرفية التي بدأت تتخّذ
موقعا وسيطا في الربط بين مشروعات ويكيميديا و كذلك بين مستودعات معرفية
أخرى عديدة غيرها عبر الوِب الدلالية (semantic web)، فإن تداعيات هذه
الأخطاء ستكون تراكمية و عصيّة على العلاج لاحقا، كما ستعيق تقدّم وسائل
معالجةالمعرفة باللغة العربية.

كان هذا أحد الأسباب التي دعتني سنة 2004 إلى الشروع في العمل على مراجعة و
استكمال تعريب مفردات Dublin Core التي كانت وقتذاك مواصفة رائدة في مجال
الوسم الدلالي على الإنترنت. لكني لم تكن لدي المعرفة و لا الوقت الكافيان
وقتها لإتمام ذلك العمل.

المثال الذي وقعت عليه في نظرتي السريعة هو
 https://wikidata.org/wiki/Special:PermanentLink/573476718

حاليا "instance of" تقابلها في العربية في ويكيداتا "حالة خاصة من".

المشكلة الأساسية في هذا التعريب أنه خاطئ دلاليا. و في هذا المستوى من
التجريد تكون الدقة الدلالية هي حدّا قاطعًا لا تهاون فيه. إذ لا سياق و لا
حشو لغوي يعيننا على الاستنباط، بل علاقات إبستمولوجية صافية و برمجيات
(المستنبطات الدلالية semantic reasoners) تستنتج و تقيس و تربط آليا. هذه
ليست لغة بشرية طبيعية، و إن بدت كذلك. تصوّروا مبرمجا يستعمل كلمات محل
كلمات وتركايب محلّ تراكيب في لغة برمجة و يتوقّع أن يعمل البرنامج على ما يُرام!

بحكم انشغالي بمسائل التعريب و الكتابة في تقنية المعلوماتية و
الأونطولوجيا أدرك مدى صعوبة التصدّي لتعريب من هذا القبيل، برغم أنّ هذه
المفردة تحديدا، أي "instance"، إحدى لبِنات الفكر المعلوماتي (فهي ضمن
مفاهيم البرمجة الشيئية الموجودة منذ عقود).

رجوعا إلى المثال الذي أعرضه هنا فيما يخصّ "instance of"، فلقد وجدت منذ
فترة ليست ببعيدة ضالتي في كلمة "حَتَّة"، من الفعل "حتَّ يحتَّ" أي قطع و
شكَّل. إذن "instance of" ينبغي أن تقابلها في العربية "حَتَّةٌ".

مشكلة أخرى في التعريب القائم حاليا في ويكيداتا -بتجاوز نقطة الخطأ الصريح
فيه، و بفرض أنه كان خيارا متاحا من الناحية الدلالية- هي أنه قطع علينا
طريق استعمال "حالة خاصة" كمقابل صائب لمصطلح آخر في نفس السياق و المجال
هو "special case"
https://www.wikidata.org/wiki/Q2890061

مسألة "قطع الطريق" هذه من المسائل التي كثيرا ما يُغفلها المعرّبون
التقنين و المترجمون، إذ أن آثارها لا تكون دوما بادية للقائم بالتعريب
لحظة اختياره من بين الخيارات التعريبية المتاحة، ما لم يبذل جهدا إضافيا
لاستشراف الاستعمالات الأخرى للكلمة، لا في المجال المعرفي المباشر الذي
يتناوله و حسب، بل في المجالات المعرفية المجاورة، لتحقيق الاتّساق و
التناغم، و لتلافي التضاربات الحالية أو الواردة، بقدر الإمكان. مشكلتا
*التخصيص* بغير لزوم و *التعميم* بغير لزوم عند التعريب، أي توسيع أو تضييق
مجال الدلالة عمّا في المصدر، هما أيضا حالتنا فرعيتان من هذه الحالة العامة.

لننظر كذلك في التعريف العربي الحالي لتلك المفردة:
"صنف من الأشياء يوجد شيء واحد منه ولا يتكرر. ويجب أن لا يتم الخلط بينه
وبين الخاصية: P279 (نوع فرعي من)."

في حين ينبغي أن يكون:
"فئة من الموجودات ينتمي إليها الموضوع. و تجب التفرقة بين هذه و الخاصية
P279: 'فئة فرعية من'"

لا مجال هنا على الإطلاق للطرح "يوجد شيء واحد منه ولا يتكرر"، فهذا خطأ
بيّن في تعريف الدلالة المعرفية لهذه المفردة. "فدليل المستركبين في
المجرة" *حَتّة* من الفئة "فلم" لكنّه لا ينطبق عليه إنه "يوجد شيء واحد
منه ولا يتكرر"، ففعليا توجد حَتَّات أخرى من الفئة "فلم"، أي توجد أفلام
أخرى عديدة في عالمنا.

هنا تتبدّى فئة أخرى من أخطاء الترجمة، هي أخطاء عدم الإلمام بمنطق اللغة
المصدر في مستويات أساسية، و هي أخطاء تشيع في تعريبات البرمجيات الحرّة
عموما بحكم كون المساهمين بالترجمة ذوي مهارات لغوية مختلفة، و هذا عموما
من المقبول في نموذج العمل التشاركي لحركة البرمجيات الحرة. توجد من هذه
الفئة من الأخطاء أمثلة عديدة في تعريب واجهة ميدياويكي و SMW، بعضها يصل
إلى كون المعنى في العربية عكس ما في الأصل!

حتّى على المستوى النحوي العربي البحت فالصياغة فيها خطأ: "بينه و بين"،
لكنّه فعليا أقل فداحة من غيره لكون المستهدفين بها البشر.

ما أدخل هذا الموضوع في انتباهي اليوم رسالة أرسلت على قائمتنا البريدية
هذه يتاريخ 11\10\2017 بعنوان "المشاركة في دارسة علمية عن تحرير ويكيبيديا
العربية" من الباحثين لوسي أيمي كافيه و هادي السحار و بافلوس فويوكليس، و
موضوع دراستهم التوليد الحاسوبي للنصوص العربية في ويكيبيديا، بغرض مساعدة
المُحررين.

في الاستبيان الذي أرسله الباحثون معلومات مستقاة من ويكيداتا يطلبون من
المشتركين في الدراسة صياغتها في شكل مقدّمات مقالات عربية في ويكيبيديا،
بغرض توليد نماذج حاسوبية لغوية لتمكين البرمجيات من فعل الشيء نفسه: أي
كتابة مقالات عربية عن موضوعات باستقاء بياناتها من ويكيداتا.

لذلك كان استنتاج كون المسألة غير هيّنة، و تجب مقاربتها بحذر، و
بالاستعانة بخبراء في حقول الإبستومولوجيا و الأنطولوجيا، وتطعيم ذلك بما
لدينا نحن من إقدام على الاجتهاد و الابتكار و الاستباط اللغوي. و في ذات
الوقت فإن ذلك يجب أن يحدث سريعا لأن التسارع في بناء طبقات تقنية و معرفية
فوق هذا الأساس لن يتوقّف، و إذا ارتفع البناء مائلا فستتعذّر لاحقا معالجة
الأساسات. يجب أن تكون اللبنات مستوية لكي يكون البناء صحيحا. و فداحة
الأخطاء تزيد عندما تكون في الأصول عنها في الفروع.

و نحن في تاريخ موسوعتنا و تاريخ البرمجيات عموما حالات وجدنا فيها أنفسنا
كمجتمع المعنيين بالتعريب في مواجهة مأزق صعوبة التصويب و التعديل لحالات
بعضها أخطاء صريحة و أغلبها ليست أخطاء لكنها اختيارات أقل جودة و أكثر
مدعاة للغموض و التضارب، و كانت الذريعة دوما كون التغييرات ستعطّل كثيرا
من الآليات *المستقرة* أو حتى *الاعتياد و الشيوع*.

بحكم كوننا في موضع ثانوي في مسيرة إنتاج المعرفة عالميا اليوم، و بسبب
اشتباكنا الوثيق -هنا في ويكيبيديا و في حركةالبرمجيات\المعرفة الحرّة
عموما- بهذه المسيرة، نجد أنفسنا مضطرين إلى ملاحقة تطورات قلّما اشتركنا
في صنعها، و في الوقت ذاته يكون علينا التمعّن و الحذاقة في تلك المواكبة و
التبّني و الأقلمة و التوطين. معادلة صعبة

كنت أودّ لو أتقدم إلى المهتمين بطرح لهذا الموضوع في مؤتمر ويكي عربية
القادم الذي تستضيفه مؤسستنا. لكني للأسف بحكم ارتباطات مسبقة بعملي في
المؤسسة فإنني لن أكون موجودا في القاهرة وقت انعقاد المؤتمر.

لكني مع هذا أرجو أن أجد فرصة للاشتباك مع المهتمين بهذه المسألة في حين
آخر، على نحو ما.

و سلام،
أحمد غربية

_______________________________________________
Wikiar-l mailing list
https://ar.wikipedia.org
[hidden email]
https://lists.wikimedia.org/mailman/listinfo/wikiar-l