محلات الصرافة في صنعاء تفاجئ المواطنين بقرار صادم بشأن الحوالات .. عقب قرارات البنك المركزي في عدن    إعلان قطري عن دعم كبير لليمن    جماعة الحوثي تفرض اشتراط واحد لنقل المقرات الرئيسية للبنوك إلى عدن !    خمسة ابراج لديهم الحظ الاروع خلال الأيام القادمة ماليا واجتماعيا    حلم اللقب يتواصل: أنس جابر تُحجز مكانها في ربع نهائي رولان غاروس    قرارات البنك المركزي لإجبار الحوثي على السماح بتصدير النفط    تعرف على قائمة قادة منتخب المانيا في يورو 2024    7000 ريال فقط مهر العروس في قرية يمنية: خطوة نحو تيسير الزواج أم تحدي للتقاليد؟    انتقالي حضرموت يرفض استقدام قوات أخرى لا تخضع لسيطرة النخبة    فيديو صادم يهز اليمن.. تعذيب 7 شباب يمنيين من قبل الجيش العماني بطريقة وحشية ورميهم في الصحراء    فضيحة: شركات أمريكية وإسرائيلية تعمل بدعم حوثي في مناطق الصراع اليمنية!    أرواح بريئة تُزهق.. القتلة في قبضة الأمن بشبوة وتعز وعدن    "حرمان خمسين قرية من الماء: الحوثيون يوقفون مشروع مياه أهلي في إب"    مسلحو الحوثي يقتحمون مرفقًا حكوميًا في إب ويختطفون موظفًا    الدبابات الغربية تتحول إلى "دمى حديدية" بحديقة النصر الروسية    حرب وشيكة في الجوف..استنفار قبلي ينذر بانفجار الوضع عسكرياً ضد الحوثيين    صحفي يكشف المستور: كيف حول الحوثيون الاقتصاد اليمني إلى لعبة في أيديهم؟    إنجاز عالمي تاريخي يمني : شاب يفوز ببطولة في السويد    المجلس الانتقالي يبذل جهود مكثفة لرفع المعاناة عن شعب الجنوب    عن ماهي الدولة وإستعادة الدولة الجنوبية    الوضع متوتر وتوقعات بثورة غضب ...مليشيا الحوثي تقتحم قرى في البيضاء وتختطف زعيم قبلي    عن الشباب وأهمية النموذج الحسن    حرب غزة.. المالديف تحظر دخول الإسرائيليين أراضيها    - الصحفي السقلدي يكشف عن قرارات التعيين والغائها لمناصب في عدن حسب المزاج واستغرب ان القرارات تصدر من جهة وتلغى من جهة اخرى    بحضور نائب الوزير افتتاح الدورة التدريبية لتدريب المدربين حول المخاطر والمشاركة المجتمعية ومرض الكوليرا    شرح كيف يتم افشال المخطط    بدء دورة تدريبية في مجال التربية الحيوانية بمنطقة بور    صحة غزة: ارتفاع حصيلة الشهداء إلى 36 ألفا و439 منذ 7 أكتوبر    "أوبك+" تتفق على تمديد خفض الإنتاج لدعم أسعار النفط    ولي العهد الكويتي الجديد يؤدي اليمين الدستورية    رصد تدين أوامر الإعدام الحوثية وتطالب الأمم المتحدة بالتدخل لإيقاف المحاكمات الجماعية    الملايين بالعملة الصعبة دخل القنصليات يلتهمها أحمد بن مبارك لأربع سنوات ماضية    5 آلاف عبر مطار صنعاء.. وصول 14 ألف حاج يمني إلى السعودية    أولى جلسة محاكمة قاتل ومغتصب الطفلة ''شمس'' بعدن    ريال مدريد يتوج بلقب دوري أبطال أوروبا    بالصور: اهتمام دبلوماسي بمنتخب السيدات السعودي في إسبانيا    من لطائف تشابه الأسماء .. محمود شاكر    مصرف الراجحي يوقف تحويلاته عبر ستة بنوك تجارية يمنية بتوجيهات من البنك المركزي في عدن    تاجرين من كبار الفاسدين اليمنيين يسيطران على كهرباء عدن    يمني يتوج بجائزة أفضل معلق عربي لعام 2024    مانشستر يونايتد يقترب من خطف لاعب جديد    نابولي يقترب من ضم مدافع تورينو بونجورنو    وصول أكثر من 14 ألف حاج يمني إلى الأراضي المقدسة    عبدالله بالخير يبدي رغبته في خطوبة هيفاء وهبي.. هل قرر الزواج؟ (فيديو)    صلاة الضحى: مفتاحٌ لبركة الله ونعمه في حياتك    الحديدة.. وفاة عشرة أشخاص وإصابة آخرين بحادث تصادم مروع    خراب    الوحدة التنفيذية لإدارة مخيمات النازحين: 18 ألف أسرة نازحة في مأرب مهددة بالطرد من مساكنها مميز    السعودية تضع شرطًا صارمًا على الحجاج تنفيذه وتوثيقه قبل موسم الحج    هدي النبي صلى الله عليه وسلم في حجه وعمراته    شاهد .. الضباع تهاجم منزل مواطن وسط اليمن وتفترس أكثر 30 رأسًا من الغنم (فيديو)    الوجه الأسود للعولمة    الطوفان يسطر مواقف الشرف    تحذير هام من مستشفيات صنعاء للمواطنين من انتشار داء خطير    المطرقة فيزيائياً.. وأداتياً مميز    الفنان محمد محسن عطروش يعض اليد السلطانية الفضلية التي أكرمته وعلمته في القاهرة    ثالث حادثة خلال أيام.. وفاة مواطن جراء خطأ طبي في محافظة إب    شاب يبدع في تقديم شاهي البخاري الحضرمي في سيئون    







شكرا على الإبلاغ!
سيتم حجب هذه الصورة تلقائيا عندما يتم الإبلاغ عنها من طرف عدة أشخاص.



ادخال اللغة العربية لعالم الذكاء الاصطناعي!!!!!
نشر في يمن فويس يوم 13 - 11 - 2019

النص الرقمي يقدم العديد من المزايا اقلها إنها مدمجة ومتعددة الاستخدامات وسهلة التحليل والمعالجة و التفسير. ومع ذلك فانه حتى اليوم هناك العديد من الوثائق في شكلها الورقي لم يتم تحويلها الى نصوص رقمية وبالذات في النصوص التاريخية على الرغم من وجود حلول قوية للكشف التلقائي عن المواد المطبوعة إلا أن التعرف على المخطوطات العربية لا يزال يمثل مشكلة معقدة.
فعلى سبيل المثال ينطبق هذا بشكل خاص على النصوص المتماسكة مثل تلك الموجودة في المجموعات والكتب التاريخية واذكر هنا وثائق الارشيف العثماني والحديث عن اكثر من 100 مليون وثيقة مكتوبة بحروف عربية. وانطلاقا من ذلك تعد قواعد البيانات الملائمة و الواسعة ذات أهمية كبيرة سواء للتقييم التجريبي أو لتدريب حلول التعرف التلقائي للحروف والكلمات والمحتوى بطرق الذكاء الاصطناعي ونعني هنا الكلمات المكتوبة بخط اليد كون ذلك يسهل عملية تحويل الوثائق التاريخية اقلها الى نصوص رقمية ومن ثم تفسيرها وتحليلها بطرق الذكاء الاصطناعي كونها كنز ثقافي يمثل سلوك ونهج بشري مهم لأمم مختلفة وحقب تاريخية متعددة .
و نظرًا للتعقيد المرتبط باللغة العربية فان قواعد البيانات الحالية تحتوي دائمًا على قيود على النطاق و المفردات المستخدمة ومستوى تفاصيل الحقائق الأساسية المرفقة وكل ذلك مهم جدا للخلايا العصبية الاصطناعية في انظمة التعلم التلقائي. لذلك انطلقنا هنا من استراتيجية واحدة لمعالجة هذا هو إنشاء عينات اصطناعية لانتاج كلمات عربية لعشرات الالف والتي يجب ان تعكس اننا جمعنا خطوط يد ل 50 الف شخص وبوثائق تاريخية.
تم تقديم مقاربة جديدة هنا لتوليف الكتابة اليدوية العربية والتي مثلت مساهمة مهمة في البحث العلمي في هذا المجال كون المقاربات الحالية تجمع مقتطفات من الحروف العربية فقط (والتي تسمح فقط ببعض التوليفات المختلفة) و لا تنتج مخطوطات كاملة كما وصلنا اليها. في المقابل فإن النظام المقدم في ابحاثنا يجعل من الممكن توليد عدد كبير من التوليفات المختلفة للكلمات العربية أو الجمل أو الصفحات النصية ذات العمود الواحد.
و يتضمن على سبيل التبسيط هنا ان النهج او النظام يولد رسائل جديدة لكل توليف بالإضافة إلى تعديلات على الحروف الكاملة على سبيل المثال عن طريق تغيير ميل الخط. علاوة على ذلك فان الانظمة الذكية التي تم تصميمها تقدم طرق لمحاكاة الاختلافات صبغت لتعتمد على المواد, بيحث ينتج خطوط تاريخية و وثائق يمكن اعتبارها نقطة لانتاج محاكاة حقيقة .
هذا قادنا اي نظام التوليف بنجاح لاستكمال بنك البيانات IESK arDB - و الذي هو قاعدة بيانات متاحة مجانًا للباحثين تم إنشاؤها منا بجهود 8 سنوات للذكاء الاصطناعي بخصوص معرفة الحروف والكلمات العربية المكتوبة للنصوص التاريخية. هذا البنك يستخدم الان من اكثر من 30 مركز بحث دولي الى الان. بالإضافة إلى ذلك فان انظمتنا تقييم الأساليب المستندة إلى التجزئة للاعتراف التلقائي للمخطوطات العربية وتطويرها باستخدام عينات حقيقية و تركيبية. و على وجه الخصوص يشكل تصنيف الحروف حسب الميزات المحسّنة والمصنف المستندة إلى نماذج نطلق عليه النماذجات النشطة .
وتم اضافة انظمة الكشف عن الأخطاء و تصحيحها استنادًا إلى مفهوم السياق للكلمة بالإضافة إلى تقديم مقاربة محسّنة لتجزئة الخطوط والكلمات كما يسمح النظام بناء على بياناتنا الكشف عن الخطوط المنحنية للنص. ماورد هو مختصر لرسالة دكتوراه عندي قام بها احد الالمان "في الصورة " وبعد نشر 16 بحث في مجلات و مؤتمرات قلنا له الان يكفي. فخور بطلابي فلم يخرج احد من عندي الا و معه سيرة ذاتية محترمة و يفتخر بما انجز.
و مرتاح من نفسي انني لم اترك شخص اختار ان يكون معي في منتصف الطريق. وبذلك نكون قدمنا ما نقدر من بيانات اللغة العربية للذكاء الاصطناعي واليوم هذا صار ثاني رسالة دكتوراه في ادخال اللغة العربية لعالم الذكاء الاصطناعي في مجموعتي, كلفتني اموال طائلة و لسنوات اقتطعتها من مشاريع صناعية او من مدخرات مجموعتي, و الباقي تكملوا انتم ;)


انقر هنا لقراءة الخبر من مصدره.