نظام تصنيف الأسماء العربية والأعجمية

الملخص

معالجة الأسماء باستخدام النظام المتعدد يشمل إضافة علامات التشكيل والتصنيف الجغرافي والتصحيح وكذلك النقل إلى اللغات الأخرى، وهذا يشمل الأسماء في اللغات الأخرى وليس اللغة العربية فقط، أدناه قائمة بالعمليات التي يوفرها النظام.



برامج الأسماءقواعد البياناتبرامج الأسماء الجغرافية
نظام النقل الصوتي لأسماء الأعلام الأسماء العربية وحدة الرومنة
نظام رومنة الأسماء للغات اللاتينية أسماء النسبة والنسب
نظام تعريب الأسماء الأعجمية وعربنتها الأسماء العربية الكاملة
نظام استعادة الأسماء الأسماء من أصل عربي
نظام تصنيف الأسماء الأسماء الأعجمية
نظام عربنة الأسماء المرومنة واستعادتها الأسماء المميزة والأصلية
أسماء المشاهير والنجوم
الأسماء غريبة الإملاء والنطق

في حالات عديدة تكون عملية التعرف على هوية الاسم من حيث انتماءه إلى منطقة جغرافية محددة عملية مهمة للغاية ولكنها تتطلب خبرة في هذا النوع من التحليل القائم على الاحتمالات الجغرافية لأسماء ذات خصوصية مثل (باجابر) أو (بنسعيد) أو (شحاتة) ولكن عند العمل على مستوى احترافي أو يخص تطبيقات لتصنيف قوائم المشبوهين أو الوافدين إلى الدولة عن طريق الموانئ فإنه ينبغي استخدام وسائل أكثر سرعة وتطوراً وذلك لأن عملية التصنيف ليست مجرد مقارنة لنص الاسم مع قائمة تصنيف معدة من قبل بل ربما يتطلب الأمر معايير أكثر تعقيداً مثل التتابع والتقليد الإملائي وهذا يوجب إضافة عمليات أخرى من بينها التبسيط "normalization" والتصحيح للأسماء المشوهة.

نظام المصنف الجغرافي والنوعي يعد من أحدث البرامج المنتجة من قبل كلماسوفت وتعمل على تطويره حالياً ويستخدم البرنامج تقنيات الإحصاء الرياضي وحساب الاحتمالات في قالب تعليم الآلة (Machine Learning) وفي الوقت الحالي يعطي النتائج منسوبة إلى النطاقات الجغرافية على مستوى الدولة ولكن تخطط كلماسوفت لإدماج خاصيات التصنيف إلى المناطق داخل الدولة الواحدة على مستويات إقليمية محدودة، يقوم النظام كذلك بتحديد النوع أي وصف الاسم بالتذكير أو التأنيث أو الاشتراك في كليهما.

للبرنامج استعمالين الأول إمكان التصنيف الجغرافي للأسماء العربية والثاني للأسماء الأعجمية وتكون النتيجة بتحديد الدولة الأقرب أي ذات أعلى نسبة من حيث شيوع الاسم وفي حال التوصل لنتائج متقاربة فإن البرنامج يعطي اسم أكثر من دولة أو منطقة جغرافية مرتبة حسب الاحتمال الأقرب (Likelihood) وكل ذلك بمجرد إدخال الاسم الكامل وسيتعامل البرنامج مع أجزاء الاسم المختلفة ومحاولة التعرف على خصائصه.


مصنف الأسماء العربية
صورة لواجهة البرنامج، يمكنك تصفح المواصفات الفنية للنظام. أو تنزيل النسخة التجريبية.

الموقع: الموقع المقترح لوجود الاسمالنوع: استخدام الاسم (مذكر أو مؤنث)

رقم الاسم لاتيني الموقع النوع
21 الماز برهي كيداني ِAlmaz Barahi Kidany إثيوبيا – إريتريا F
22 انيل شوتلال شارما Anil Shotlal Sharma الهند M
23 البرتو دي سيلفا Alberto De Silva اسبانيا – البرتغال – البرازيل - الارجنتين M
24 أمادو بابا Amado Baba موريتانيا – النيجر – جزر القمر M
25 كرستين بيكور Christine Pecour فرنسا - أمريكا F
26 مايك كرستوفر Mic Christopher أمريكا - بريطانيا M
27 جون ماكريغور John McGregor بريطانيا – أمريكا M
28 ديفيد هازلي David Hazly أمريكا M
29 يورام كاتز Yuram Katz إسرائيل M
30 أليكسي فيديروف Alexy Fedirov روسيا M

البداية » المعالج اللغوي » معالج الأسماء » المصنف الجغرافي والنوعي للأسماء

المرجع MOLINDEX | الفئة البرامج | العائلة MAPSONOL | آخر تحديث 28/5/2021