غدُ العرب في موتِ أمسهم: الاحتفاء بميلاد العواصم (أربيل/ عدن/ رام الله)    أمريكا تغدر بالامارات بعدم الرد أو الشجب على هجمات الحوثي    الوزير البكري يلتقي بنجم الكرة الطائرة الكابتن اسار جلال    ماذا يحدث داخل حرم جامعة صنعاء .. قرار صادم لرئيس الجامعة يثير سخط واسع !    الرئيس الزُبيدي ينعي المناضل الشيخ محسن بن فريد    عندما يبكي الكبير!    حادث تصادم بين سيارة ودراجة نارية على متنها 4 أشخاص والكشف عن مصيرهم    الحكومة تجدد دعمها لجهود ومساعي تحقيق السلام المبني على المرجعيات    أطفال يتسببون في حريق مساكن نازحين في شبوة بعد أيام من حادثة مماثلة بمارب    نجوم كرة القدم والإعلام في مباراة تضامنية غداً بالكويت    اشتباكات بين مليشيا الحوثي خلال نبش مقبرة أثرية بحثًا عن الكنوز وسط اليمن    كارثة وشيكة في اليمن وحرمان الحكومة من نصف عائداتها.. صندوق النقد الدولي يدق ناقوس الخطر    أسعار صرف العملات الأجنبية مقابل الريال اليمني في صنعاء وعدن    ماذا يحدث في صفوف المليشيات؟؟ مصرع 200 حوثي أغلبهم ضباط    ثعلب يمني ذكي خدع الإمام الشافعي وكبار العلماء بطريقة ماكرة    قطوف مدهشة من روائع البلاغة القرآنية وجمال اللغة العربية    تفاصيل قرار الرئيس الزبيدي بالترقيات العسكرية    الحرب القادمة في اليمن: الصين ستدعم الحوثيين لإستنزاف واشنطن    بعد خطاب الرئيس الزبيدي: على قيادة الانتقالي الطلب من السعودية توضيح بنود الفصل السابع    كيف تفكر العقلية اليمنية التآمرية في عهد الأئمة والثوار الأدوات    المشرف العام خراز : النجاحات المتواصلة التي تتحقق ليست إلا ثمرة عطاء طبيعية لهذا الدعم والتوجيهات السديدة .    الحوثيون يزرعون الموت في مضيق باب المندب: قوارب صيد مفخخة تهدد الملاحة الدولية!    أرسنال يفوز من جديد.. الكرة في ملعب مان سيتي    شيخ حوثي يعلنها صراحة: النهاية تقترب واحتقان شعبي واسع ضد الجماعة بمناطق سيطرتها    دعاء يغفر الذنوب والكبائر.. الجأ إلى ربك بهذه الكلمات    مارب.. تكريم 51 حافظاً مجازاً بالسند المتصل    مأرب تغرق في الظلام ل 20 ساعة بسبب عطل فني في محطة مأرب الغازية    " محافظ شبوة السابق "بن عديو" يدقّ ناقوس الخطر: اليمن على شفير الهاوية "    الدوري الاسباني: اتلتيكو مدريد يفوز على مايوركا ويقلص الفارق مع برشلونة    رسالة حوثية نارية لدولة عربية: صاروخ حوثي يسقط في دولة عربية و يهدد بجر المنطقة إلى حرب جديدة    مقرب من الحوثيين : الأحداث في اليمن تمهيد لمواقف أكبر واكثر تأثيرا    ريال مدريد يسيطر على إسبانيا... وجيرونا يكتب ملحمة تاريخية تُطيح ببرشلونة وتُرسله إلى الدوري الأوروبي!    تكريم مشروع مسام في مقر الأمم المتحدة بجنيف    يا أبناء عدن: احمدوا الله على انقطاع الكهرباء فهي ضارة وملعونة و"بنت" كلب    #سقطرى ليست طبيعة خلابة وطيور نادرة.. بل 200 ألف كيلومتر حقول نفط    الثلاثاء القادم في مصر مؤسسة تكوين تستضيف الروائيين (المقري ونصر الله)    آرسنال يُسقط بورنموث ويعزز صدارته للدوري الإنجليزي    مكتب الأوقاف بمأرب يكرم 51 حافظاً وحافظة للقران من المجازين بالسند    صندوق النقد الدولي يحذر من تفاقم الوضع الهش في اليمن بفعل التوترات الإقليمية مميز    صحة غزة: ارتفاع حصيلة الشهداء إلى 34 ألفا و654 منذ 7 أكتوبر    نقابة الصحفيين والإعلاميين الجنوبيين تصدر بيانا مهما في اليوم العالمي لحرية الصحافة (3 مايو)    في ظل موجة جديدة تضرب المحافظة.. وفاة وإصابة أكثر من 27 شخصا بالكوليرا في إب    الرئيس الزُبيدي : نلتزم بالتفاوض لحل قضية الجنوب ولا نغفل خيارات أخرى    تعز مدينة الدهشة والبرود والفرح الحزين    أفضل 15 صيغة للصلاة على النبي لزيادة الرزق وقضاء الحاجة.. اغتنمها الآن    تتقدمهم قيادات الحزب.. حشود غفيرة تشيع جثمان أمين إصلاح وادي حضرموت باشغيوان    بالفيديو.. داعية مصري : الحجامة تخريف وليست سنة نبوية    صحيح العقيدة اهم من سن القوانين.. قيادة السيارة ومبايض المرأة    بعد إثارة الجدل.. بالفيديو: داعية يرد على عالم الآثار زاهي حواس بشأن عدم وجود دليل لوجود الأنبياء في مصر    ناشط من عدن ينتقد تضليل الهيئة العليا للأدوية بشأن حاويات الأدوية    الارياني: مليشيا الحوثي استغلت أحداث غزه لصرف الأنظار عن نهبها للإيرادات والمرتبات    أثر جانبي خطير لأدوية حرقة المعدة    الصين تجدد دعمها للشرعية ومساندة الجهود الأممية والإقليمية لإنهاء الحرب في اليمن    ضلت تقاوم وتصرخ طوال أسابيع ولا مجيب .. كهرباء عدن تحتضر    انتقالي لحج يستعيد مقر اتحاد أدباء وكتاب الجنوب بعد إن كان مقتحما منذ حرب 2015    المخا ستفوج لاول مرة بينما صنعاء تعتبر الثالثة لمطاري جدة والمدينة المنورة    النخب اليمنية و"أشرف"... (قصة حقيقية)    - نورا الفرح مذيعة قناة اليمن اليوم بصنعاء التي ابكت ضيوفها    







شكرا على الإبلاغ!
سيتم حجب هذه الصورة تلقائيا عندما يتم الإبلاغ عنها من طرف عدة أشخاص.



ادخال اللغة العربية لعالم الذكاء الاصطناعي!!!!!
نشر في يمن فويس يوم 13 - 11 - 2019

النص الرقمي يقدم العديد من المزايا اقلها إنها مدمجة ومتعددة الاستخدامات وسهلة التحليل والمعالجة و التفسير. ومع ذلك فانه حتى اليوم هناك العديد من الوثائق في شكلها الورقي لم يتم تحويلها الى نصوص رقمية وبالذات في النصوص التاريخية على الرغم من وجود حلول قوية للكشف التلقائي عن المواد المطبوعة إلا أن التعرف على المخطوطات العربية لا يزال يمثل مشكلة معقدة.
فعلى سبيل المثال ينطبق هذا بشكل خاص على النصوص المتماسكة مثل تلك الموجودة في المجموعات والكتب التاريخية واذكر هنا وثائق الارشيف العثماني والحديث عن اكثر من 100 مليون وثيقة مكتوبة بحروف عربية. وانطلاقا من ذلك تعد قواعد البيانات الملائمة و الواسعة ذات أهمية كبيرة سواء للتقييم التجريبي أو لتدريب حلول التعرف التلقائي للحروف والكلمات والمحتوى بطرق الذكاء الاصطناعي ونعني هنا الكلمات المكتوبة بخط اليد كون ذلك يسهل عملية تحويل الوثائق التاريخية اقلها الى نصوص رقمية ومن ثم تفسيرها وتحليلها بطرق الذكاء الاصطناعي كونها كنز ثقافي يمثل سلوك ونهج بشري مهم لأمم مختلفة وحقب تاريخية متعددة .
و نظرًا للتعقيد المرتبط باللغة العربية فان قواعد البيانات الحالية تحتوي دائمًا على قيود على النطاق و المفردات المستخدمة ومستوى تفاصيل الحقائق الأساسية المرفقة وكل ذلك مهم جدا للخلايا العصبية الاصطناعية في انظمة التعلم التلقائي. لذلك انطلقنا هنا من استراتيجية واحدة لمعالجة هذا هو إنشاء عينات اصطناعية لانتاج كلمات عربية لعشرات الالف والتي يجب ان تعكس اننا جمعنا خطوط يد ل 50 الف شخص وبوثائق تاريخية.
تم تقديم مقاربة جديدة هنا لتوليف الكتابة اليدوية العربية والتي مثلت مساهمة مهمة في البحث العلمي في هذا المجال كون المقاربات الحالية تجمع مقتطفات من الحروف العربية فقط (والتي تسمح فقط ببعض التوليفات المختلفة) و لا تنتج مخطوطات كاملة كما وصلنا اليها. في المقابل فإن النظام المقدم في ابحاثنا يجعل من الممكن توليد عدد كبير من التوليفات المختلفة للكلمات العربية أو الجمل أو الصفحات النصية ذات العمود الواحد.
و يتضمن على سبيل التبسيط هنا ان النهج او النظام يولد رسائل جديدة لكل توليف بالإضافة إلى تعديلات على الحروف الكاملة على سبيل المثال عن طريق تغيير ميل الخط. علاوة على ذلك فان الانظمة الذكية التي تم تصميمها تقدم طرق لمحاكاة الاختلافات صبغت لتعتمد على المواد, بيحث ينتج خطوط تاريخية و وثائق يمكن اعتبارها نقطة لانتاج محاكاة حقيقة .
هذا قادنا اي نظام التوليف بنجاح لاستكمال بنك البيانات IESK arDB - و الذي هو قاعدة بيانات متاحة مجانًا للباحثين تم إنشاؤها منا بجهود 8 سنوات للذكاء الاصطناعي بخصوص معرفة الحروف والكلمات العربية المكتوبة للنصوص التاريخية. هذا البنك يستخدم الان من اكثر من 30 مركز بحث دولي الى الان. بالإضافة إلى ذلك فان انظمتنا تقييم الأساليب المستندة إلى التجزئة للاعتراف التلقائي للمخطوطات العربية وتطويرها باستخدام عينات حقيقية و تركيبية. و على وجه الخصوص يشكل تصنيف الحروف حسب الميزات المحسّنة والمصنف المستندة إلى نماذج نطلق عليه النماذجات النشطة .
وتم اضافة انظمة الكشف عن الأخطاء و تصحيحها استنادًا إلى مفهوم السياق للكلمة بالإضافة إلى تقديم مقاربة محسّنة لتجزئة الخطوط والكلمات كما يسمح النظام بناء على بياناتنا الكشف عن الخطوط المنحنية للنص. ماورد هو مختصر لرسالة دكتوراه عندي قام بها احد الالمان "في الصورة " وبعد نشر 16 بحث في مجلات و مؤتمرات قلنا له الان يكفي. فخور بطلابي فلم يخرج احد من عندي الا و معه سيرة ذاتية محترمة و يفتخر بما انجز.
و مرتاح من نفسي انني لم اترك شخص اختار ان يكون معي في منتصف الطريق. وبذلك نكون قدمنا ما نقدر من بيانات اللغة العربية للذكاء الاصطناعي واليوم هذا صار ثاني رسالة دكتوراه في ادخال اللغة العربية لعالم الذكاء الاصطناعي في مجموعتي, كلفتني اموال طائلة و لسنوات اقتطعتها من مشاريع صناعية او من مدخرات مجموعتي, و الباقي تكملوا انتم ;)


انقر هنا لقراءة الخبر من مصدره.