مدقّق «دال» الإملائي - الموارد الرقمية للّغة العربية

, بقلم محمد بكري

قراءة نصّ عربي فيه العديد من الأخطاء المطبعيّة والمعجميّة وأخطاء في التحريك أمر مزعج ومنفّر. خدمة المدقّق الإملائي من “دال” تساعدك في تصويب الأخطاء.

ما هو مدقّق “دال” الإملائي؟

هو مدقّق إملائي يغطّي أكثر من 98% من النصوص العربيّة الحديثة، مبنيّ على موارد لغويّة عاليّة الدقّة. يتميّز “مدقّق”دال" بقدرته على التدقيق في الكلمات المحرّكة وغير المحرّكة وتحليل وتفكيك الكلمات عن الزوائد كأدوات النصب والجرّ والضمائر المتصلة، واعتماده على قدرات التوليد للأفعال والأسماء وجموع التكسير في نظامه التشغيلي يعزّز قدرة مدقّق “دال” وفعاليته وسرعته.

مجالات مدقّق “دال” الإملائي

دور النشر والصحافة المطبوعة والإلكترونية المؤسسات الحكومية والماليّة والمصرفية القطاع التعليمي التدقيق في النصوص الأدبية والترجمات التدقيق في رسائل الماجستير والدراسات العليا للطلاب تقارير المؤسسات والجمعيات الدوليّة والمدنيّة محركات والبحث والمحتوى الرقمي العربي المستخدم اليومي.

"الإشراك في خدمة تدقيق “دال

هي خدمة أونلاين موصولة على الحاسوب أو الجوال عبر الإنترنت حصرًا، في هذه المرحلة نقدم خدمة المدقّق الإملائي من”دال" مجانًا ولفترة تجريبيّة.

التوفير في الوقت والجهد والمال

في الوقت: يحتاج مدقق “دال” الى ثانية واحدة للتدقيق في 10 صفحات.

ما هي الأخطاء الشائعة في النصوص ؟

كما في مختلف اللغات، الأخطاء الإملائية يمكن حصرها بالتالي: 1. الأخطاء الطباعية (typographical) هي أخطاء ناتجة عن عدم احترام أحكام استخدام الفاصلة والنقطة، مثل حذف الفراغ بعد الفاصلة أو النقطة أو واو العطف وغيرها. 2. الأخطاء التي تُولّد كلمات غير معجميّة: هي أخطاء ناتجة عن إبدال حرف، حذف حرف، إضافة حرف، تشكيل خطأ، استبدال حرفين، مكان الشدّة والتنوين التي تؤدي إلى مفردات من خارج المعجم 3. الأخطاء التي تُولّد كلمات معجمية: هي أخطاء ناتجة عن إبدال حرف، حذف حرف، إضافة حرف، تشكيل خطأ، استبدال حرفين، مكان الشدّة والتنوين التي تؤدي إلى مفردات معجميّة.

خصائص “دال” المميزة

يحتوي مورد “دال” اللغوي الرقمي أكبر مكتبة للكلمات والأشكال المولدة رقميًا حتى تاريخه بحيث يتعدى عدد الكلمات/الأشكال المصرّفة والمحركة جزئيًا المليارات من الأشكال تؤلف كل منها مدخلاً معجميًا مستقلاً تترابط مع مصدرها او جذرها داخل البرنامج. التعرّف والتدقيق في أكثر من 500 مليون شكل تصريفي للكلمات - نستثني أسماء العلم والمصطلحات العلميّة التي نعمل على إضافتها تباعًا التعرّف والتدقيق في النصوص والمفردات المحرّكة جزئياً أو كلياً أو بدون تحريك بالإضافة الى الشدّة الدقّة في المخرّجات والتعرّف على الكلمات تتفرّد “دال” بميزة التوليد والتحليل أي القدرة على ربط الكلمة مع السوابق واللواحق المتصلة بالكلمة من أحرف جرّ ونصب وجزم وضمائر متصلة وتصريفها وإعرابها والتدقيق بها. يحوي “دال” قاموسًا لـ 15400 فعل و30000 أسم فاعل ومفعول وهو الأكبر بين برامج تصريف الأفعال الرقمية كما يحوي على موّلد لـ 4200 مفردة جمعها تكسيري و يصرّفها وهو ما يتفرد به “دال” بالإضافة الى الأسماء والصفات والأحرف. يحدّد الكلمات غير المعروفة أو غير الواردة في قاموسه كما يمكن إضافة الكلمات المعجمية الى القاموس بسهولة ودون حاجة الى مهندس حاسوبي. السرعة والفعاليّة بمعدل 10 صفحات أو 3000 كلمة في الثانية.

قراءة المزيد

مدقّق «دال» الإملائي - الصفحة الرئسية



جريدة الحياة


الثلاثاء، ٢٧ فبراير/ شباط ٢٠١٨
جريدة الحياة
نعمه نعمه - باحث لبناني في التربية والفنون


مدقّق «دال» الإملائي يجدد التفكير في الموارد اللغوية


أطلقت مؤسسات عربية أخيراً مشاريع هدفت إلى تجسيد مفهوم المكتبات الرقميّة في لغة الضاد. وعمدت إلى تجميع الكتب من أجل وضعها على الشبكة العنكبوتية. وبرزت بين تلك المؤسّسات جهود مميّزة لـ «مكتبة الإسكندرية» و «الجامعة الأميركيّة في بيروت» و «معهد العالم العربي» في باريس وغيرها، وكانت على مستوىً قريب من المكتبات الغربيّة التي تقدمت في ذلك المجال.

وفي منتصف شباط (فبراير) 2017، أُطلِقَ مدقّق إملائي للنصوص العربية الحديثة باسم «مدقّق «دال» الإملائي». ويتميّز بقدرته على التعرّف والتدقيق في الكلمات المشكولة وغير المشكولة، والكلمات المتصلة بزوائد كحروف الجرّ والنصب والضمائر. وكذلك يحتوي قاموساً يصل إلى أكثر من 500 مليون كلمة وشكل مصرّف للأفعال والأسماء والحروف وهو يغطّي 99 في المئة من النصوص العربية الحديثة.

ولكن علام بني مدقّق «دال»؟ هل البنية البرامجية والحاسوبية الأساسية التي تسمح بتحويل الكتب الورقيّة إلى رقميّة، متوافرة حقاً في اللغة العربية؟ هل ما توفره المكتبات «الرقميّة» العربيّة يعتبر مورداً حقيقياً للطلاب والباحثين؟

يدور الكلام على عدد هائل من الكتب والمخطوطات العربية المطبوعة قبل عصر الكومبيوتر، بالتالي لا نصوص رقميّة لها ونحتاج إلى إضافتها إلى المكتبة الرقميّة.

في مسار تحويل كتاب بالفرنسيّة أو الإنكليزية من الورقي إلى الرقمي، تظهر ضرورات تشمل توافر الكتاب الورقي، وعملية المسح الضوئي، وبرنامجاً حاسوبياً للتعرف إلى صورة الحروف وتحويلها إلى حروف رقمية، ما يعرف تقنيّاً بمصطلح «أو سي آر» OCR، والتدقيق الإملائي الآلي، والتدقيق البشري، والنشر كنصّ رقمي.

أزمة المكنز : لا جدوى التراكم

يمكن تطبيق ذلك المسار في اللغات الأجنبيّة، خصوصاً مع وجود برامج حاسوبية محترفة في مجال الـ «أو سي آر» وأخرى للتدقيق الإملائي الآلي. لكن هذا المسار غير ممكن باللغّة العربيّة، خصوصاً المعطيين السابقين.

وغالباً، تعتمد المكتبات «الرقميّة» العربية مساراً قوامه توافر الكتاب الورقي، وإجراء عملية المسح الضوئي، ثم النشر كصور بصيغة «بي دي أف».

ويتزامن ذلك الجهد مع بحوث تقوم بها جامعات لإنتاج برمجيات «أو سي آر» بالعربية وهذا أمر غير سهل نظراً لخاصيّة اللغّة العربيّة وكتابتها وأنواع الخط فيها، إضافة إلى معطيات التشكيل والكلمات الموصولة والسوابق واللواحق، و... غياب مدقق إملائي آلي احترافي.

وتتحوّل المكتبة «الرقمية» العربية من وظيفتها كمورد إلى مكنز تتجمع فيه كتب بصيغة صور لا يجد الباحث فيها تمايزاً عن النسخة الورقية سوى سهولة نقلها والوصول إليها. ويعني ذلك أن الكتاب موجود ولكنك لن تستطيع البحث في محتوياته رقمياً أو إيجاد جملة أو كلمة فيه. وهناك فرق كبير بين المكنز والمورد.

ولعل التشبيه الأفضل للمكتبات العربية «الرقميّة»، هو المدقق الإملائي العربي في برنامج «أوفيس»، بمعنى أنه موجود لكنه غير فعّال ولا يستخدمه المحترفون ولا يُنصحون به.

وتكمن الإشكالية الأخرى في مهارة توظيف الموارد المتوافرة. هناك هوّة كبيرة بين التطور التقني والمهارات البشرية في قطاع التعليم. وعلى رغم دخوله عصر التكنولوجيا، لا يزال العالم العربي يتعاطى معها كمستخدم- متلقي وليس كمتفاعل، بمعنى عدم التوصّل إلى المقدرة على تطوير الأدوات التقنية وتكييفها بما يتناسب مع الحاجات القائمة. وفي أغلب الأحيان، تصبح الحواسيب والخوادم مكنزاً ولا تعمل كمورد لغوي. ما السبيل للانتقال بتلك المكتنزات إلى مرحلة تصير فيها مورداً لغويّاً؟

الحوسبة واللغة

تعرض جريدة «لو فيغارو» الفرنسية على صفحتها مُصَرّف الأفعال الفرنسية leconjugueur.lefigaro.fr. ويدقّق ذلك المُصَرّف بالأفعال، ويتعرف إلى أصل الفعل المصرّف، يحول الأرقام إلى حروف. كذلك يشمل عمله التثبت من القواعد العامة والإملاء والترجمة والمعاني، مع تمارين تفاعلية وغيرها.

في المقابل تنشر إحدى المحطات التلفزيونية العربيّة المعروفة على موقعها الإلكتروني صفحة «تعلّم العربيّة»، لكن يصعب تبيّن إن كانت تستهدف المتعلمين العرب أو الأجانب أو المختصين؟

إذ يفتقر واضعوها إلى المهارات التعليميّة، وتنقص أداؤهم المعرفة والفهم في جعل الصفحة الإلكترونية مادة تخدم مستخدمها. ويضعون نماذج لتمارين لغوية لا تختلف عن تمارين الكتاب المدرسي أي التمارين الموجهة والتي لا تحتمل إلا إجابة أحادية. وفي خانة «الموارد» يقدم الموقع: التشكيل، القاموس، التحليل اللغوي، ومذيلاً بعبارة «هذه الخدمة الآلية قد لا تكون دقيقة تماماً»، والحقيقة أن نسب الخطأ فيها كبيرة ومن المستغرب أن يكون موقعها في صفحة «تعلّم العربية».

لا تهدف المقارنة إلى التقليل من الجهد المبذول في تلك المحطة التلفزيونية، بل توضيح الإساءة تجاه اللغة، وادعاء عظائم الأمور في ظل الافتقار إلى التعامل بتواضع ودقّة مع ما ندّعي أنه مورد تعليمي.

هناك قوة في صفحة التصريف في «لو فيغارو» متأتّية من البساطة والدقّة والتواضع، مع عدم ذكر التعلّم أو التعليم كونه لذوي الاختصاص والتعليم من خلال التكنولوجيا، ما يجعلها ببساطة مورداً تعلّمياً فعلياً للغتها.

وفي علوم المعلوماتيّة والحوسبة، تتألّف الموارد اللغويّة في مساحتين. ويتمثّل أولهما في الموارد المعجميّة التي تشمل الأفعال والأسماء والحروف والتكوين الشكلي- الصوتي (مورفوفونولوجي) للكلمات، وتكوين المفردات والمتغيرات الإملائية. ويتجسّد الثاني في الموارد النحويّة، أي بناء الجمل وتكوينها.

تذكير بتجربة من برامج «أوفيس»

ثمة مثال مألوف عن الموارد الرقميّة للعربيّة، يمثّله المدقّق الإملائي في «مايكروسوفت أوفيس» الذي لطالما أثار أسئلة عن مدى كونه مورداً لغويّاً فعليّاً.

في عام 1997، ضمّنت شركة «مايكروسوفت» برامج «أوفيس»، مدقّقاً إملائيّاً عربيّاً من صنع شركة «كولتك.كوم» Coltec.com المصريّة التي يأتي اسمها من الحروف الأولى لعبارةComputer & Language Technology، وتعني حرفيّاً «الكومبيوتر وتكنولوجيا اللغة». وتكونّ انطباع واسع لدى الجمهور الإلكتروني العربي بأن ذلك المُدقّق لم يكن بالدقة اللازمة. لذا، عمدت مايكروسوفت إلى استبداله بمدقّق صنعه فريق من خبرائها، يستند في جزء من عمله إلى مكنز أساسي يتمتع بمرونة تمكنّه من قبول تغذيته بمفردات يقدّمها الجمهور، ما يساهم في تجديده بطريقة مستمرّة.

وهناك آليّة مشابهة معتمدة في الهواتف الذكيّة. وعند كتابة كلمة ما وتكرارها تدخل تلقائياً في مكنز الهاتف، فيصبح لدى المستخدم «قاموس» للكلمات التي يستعملها في كتابة الرسائل النصيّة على الهاتف. وفي المقابل، يتطلّب تعميم تلك الطريقة توافر آلية عمل معقّدة، وفريق تدقيق ومراقبة وتحديث للمداخل المعجميّة، إضافة إلى ضرورة التنبّه إلى دخول مفردات عاميّة وأخطاء شائعة إلى ذلك المكنز.

وكذلك تغيب القدرة على توليد المفردات عن ذلك المكنز، بمعنى أن الكلمة التي تدخل بصيغة المذكّر مثلاً، لا يصنع المكنز لها مؤنّثها أو صيغ جمعها، وكذلك الحال بالنسبة إلى مسألة إدخال سوابق ولواحق على الكلمات المفردة، ما يوجب إدخال تلك الصيغة بصورة مستقلة. وتالياً، عندما تسير الأمور على ذلك النحو، يتضّخم المكنز ويصبح مثقلاً بملايين المفردات، وهو أمر يشكّل عائقاً ضخماً أمام سهولة استعماله.

بالنتيجة، يؤدي مزيج التضخّم وانخفاض الدقّة وضآلة المصادر اللغويّة الموثوقة وغيرها، إلى عدم صلاحية استخدام ذلك المدقق الإملائي مورداً لغويّاً فعليّاً للعربيّة.

عن موقع جريدة الحياة

جريدة الحياة

“الحياة” صحيفة يومية سياسية عربية دولية مستقلة. هكذا اختارها مؤسسها كامل مروة منذ صدور عددها الأول في بيروت 28 كانون الثاني (يناير) 1946، (25 صفر 1365هـ). وهو الخط الذي أكده ناشرها مذ عاودت صدورها عام1988.

منذ عهدها الأول كانت “الحياة” سبّاقة في التجديد شكلاً ومضموناً وتجربة مهنية صحافية. وفي تجدّدها الحديث سارعت إلى الأخذ بمستجدات العصر وتقنيات الاتصال. وكرست المزاوجة الفريدة بين نقل الأخبار وكشفها وبين الرأي الحر والرصين. والهاجس دائماً التزام عربي منفتح واندماج في العصر من دون ذوبان.

اختارت “الحياة” لندن مقراً رئيساً، وفيه تستقبل أخبار كل العالم عبر شبكة باهرة من المراسلين، ومنه تنطلق عبر الأقمار الاصطناعية لتطبع في مدن عربية وأجنبية عدة.

تميزت “الحياة” منذ عودتها إلى الصدور في تشرين الأول (أكتوبر) 1988 بالتنوع والتخصّص. ففي عصر انفجار المعلومات لم يعد المفهوم التقليدي للعمل الصحافي راوياً لظمأ قارئ متطلب، ولم يعد القبول بالقليل والعام كافياً للتجاوب مع قارئ زمن الفضائيات والإنترنت. ولأن الوقت أصبح أكثر قيمة وأسرع وتيرة، تأقلمت “الحياة” وكتابها ومراسلوها مع النمط الجديد. فصارت أخبارها أكثر مباشرة ومواضيعها أقصر وأقرب إلى التناول، وكان شكل “الحياة” رشيقاً مذ خرجت بحلتها الجديدة.

باختصار، تقدم “الحياة” نموذجاً عصرياً للصحافة المكتوبة، أنيقاً لكنه في متناول الجميع. هو زوّادة النخبة في مراكز القرار والمكاتب والدواوين والبيوت، لكنه رفيق الجميع نساء ورجالاً وشباباً، فكل واحد يجد فيه ما يمكن أن يفيد أو يعبّر عن رأيٍ أو شعورٍ أو يتوقع توجهات.



جريدة الأخبار اللبنانية


العدد ٣١٢٠ الاثنين ٦ آذار ٢٠١٧
جريدة الأخبار
ادب وفنون


مدقّق «دال» الإملائي : خدمة رقمية للغة العربية


بات بإمكان التلامذة وطلاب الدراسات العليا ودور النشر والصحافة المكتوبة والإلكترونية وموظفي المؤسسات الحكومية والمالية والمصرفية تدقيق رسائلهم وتقاريرهم بواسطة مدقق «دال» الإملائي. ففي أوائل شباط الماضي، أطلقت شركة «دال للموارد الرقمية للّغة العربيّة» موقعاً إلكترونياً يغطي أكثر من 98% من النصوص العربيّة الحديثة.

خلف هذا المدقق يقف مورد رقمي لتوليد الكلمات والأفعال، وهو ذو استعمالات متعددة منها الاستعمالات التعليمية. فالمورد يقدم سلّة من خمسة تطبيقات هي: تصريف الأفعال العربية، توليد الأسماء (اسمي الفاعل والمفعول)، التشكيل الكلّي أو الجزئي، جمع التكسير والمدقّق الإملائي. ويستطيع تحليل وتفكيك الكلمات عن الزوائد مثل أدوات النصب والجرّ والضمائر المتصلة، وهو قادر أيضاً على تحقيق عمليات بالغة التعقيد في اللّغة العربيّة بسرعة قياسية، وعلى حاسوب منزلي تصل إلى 10 صفحات في الثانية الواحدة ويستطيع توليد 6 ملايين كلمة في الدقيقة الواحدة.

ويشرح مدير الشركة نعمه نعمه أن المشروع له بعد اجتماعي وتربوي يطال الفئات الأقل حظاً في الحصول على خدمات وتسهيلات ترفع من مستوى التعلّم والاكتساب لدى التلامذة. وهو يوفر خدمات تعلميّة رقميّة (E-Learning facilities) للّغة العربيّة للتلامذة في المدارس الرسمية في لبنان، ويمكن توسعته ليشمل تلامذة المدارس الخاصة بشروط مختلفة.

ما هي المقاربة التعليمية التفاعليّة؟ يقول نعمه إننا «نعمل على وضع تصوّر متكامل لأداة تعليميّة رقميّة سهلة الإدارة والتشغيل من المعلمين أنفسهم ستعتمد على قالب (Template) مبسط يسمح لأي منهم بناء التمرين الصفّي أو المنزلي بحسب حاجات التلامذة التعلميّة».

كذلك سيُستخدم الموقع الإلكتروني كأداة تقييم لأداء التلامذة والمعلمين على السواء، فكل مستخدم منهم له اسم ورمز للتعريف يحدد المستوى الأكاديمي والصفّ ورمز المدرسة، وبناءً عليه يمكن توظيف البرنامج كأداة تقييم مساعدة لمتابعة مستوى الاكتساب عند التلامذة بحسب الخصائص التي يحددها المعلّم. البرنامج لا ينوي، كما يقول نعمه، إلغاء دور المعلم في التقييم والمتابعة ووضع التمارين، بل مساعدته على مراقبة أداء التلامذة من خلال إضافة تقييمه وتحت إشراف المنسق العام للمادة.

يُعدّ فريق «دال» عدداً من التمارين النموذجية إضافة الى قالب (Template) للتمارين للأساتذة. كما يجهز الموارد للاستخدام في موقع تفاعلي لتأمين هذه الخدمات التعلميّة للأعداد الكبيرة من المستخدمين مجاناً. ويمنح الفريق التدريب لعدد من المدربين/ات لاستخدام الموقع يقومون بدورهم بتدريب المعلمين/ات المعنيين/ت. وتستمر خدمات «دال» مجانية حتى انتهاء المدة المحددة في التمويل.

الاشتراك في تدقيق «دال»، هي خدمة «أونلاين» موصولة على الحاسوب أو الجوال عبر الإنترنت حصراً. ويمكن الدخول إلى الموقع واستخدامه على الرابط الآتي:http://dal.univ-mlv.fr/

عن موقع جريدة الأخبار اللبنانية

حقوق النشر
مقالات «الأخبار» متوفرة تحت رخصة المشاع الإبداعي، ٢٠١٠
(يتوجب نسب المقال الى «الأخبار» ‪-‬ يحظر استخدام العمل لأية غايات تجارية ‪-‬ يُحظر القيام بأي تعديل، تحوير أو تغيير في النص)
لمزيد من المعلومات عن حقوق النشر تحت رخص المشاع الإبداعي، انقر هنا

عرّف بهذه الصفحة

Imprimer cette page (impression du contenu de la page)