Arabic Part of Speech Tagset "KTagset"

Synopsis

Part of speech tagging is the process of selecting the most likely sequence of syntactic categories for the words in a sentence. It determines grammatical characteristics of the words, such as part of speech, grammatical number, gender, person, etc. In the case of Arabic language, this task is not a trivial one since most of the words are ambiguous as a result of the absence of vowels.

The system uses a special tagset designed for this purpose shown here.

Kalmasoft's Tagset (© KTagset) is the generic tagset for the Arabic PoS Tagger, it is the default tagset used by the system, but many other mappings are available as optional.

A tag is string of twenty two characters grouped in three 4-letters sets and one 10-letters set [4-10-4-4], the 10 letters ends with two digits to indicate the language variety while the rest of letters have their different grammatical notation, each letter may have different representation depending on the set it resides in and the specific position it occupies, basically the tag string is case sensitive and broadly categorized as follows {syntax}{morphology}{semantics}{ontology}.

"يستبدلانكن" => {VIIA}{TA3DM2PF10}{••••}{••••}
ترميز كلماسوفت (KTagset) يستخدم سلسلة من اثنين وعشرين حرفاً موزعة إلى أربعة مجموعات الثانية منها تضم عشرة أحرف تنتهي برقم يبين مستوى اللغة بينما البقية تتألف من أربعة لكل مجموعة، أي حرف في الترميز يأخذ وظيفته بحسب المجموعة وترتيبه داخلها، الترميز مرتب إلى الوظائف التالية (النحو، الإملاء، الدلالة، التكوين).

PositionTagEnglishArabic
1Nnounإسم
1Vverbفعل
1Pparticleأداة
1Ssymbolرمز
1Dnumberرقم
1Lscriptكتابة
1Eentityمعرف
1Xunparsedمجهول
not applicableغير مطلوب
Tensesالأزمان
2Pperfective, pastماض
2Iimperfective, presentمضارع
2Ffutureمستقبل
Moodsالبناء
3Iindicativeمبني على الضم
3Ssubjunctiveمبني على الفتح
3Mimperativeأمر
3Jjussiveمجزوم
3Eemphaticفعل مؤكد
Voicesالصيغة
4Aactive voiceمبني للمعلوم
4Ppassive voiceمبني للمجهول
Transitivityالتعدي
5Iintransitiveلازم
5Ttransitiveمتعد
5Dditransitiveمتعد لمفعولين
5Aambitransitiveمتعد ولازم
Formsالأوزان
61-9Form 1-9فَعلَ, فَعَّلَ, فاعَلَ, أفْعَلَ, تَفَعَّلَ, تَفاعَلَ, اِنْفَعَلَ, اِفْتَعَلَ, اِفْعَلَّ
6A-FForm 10-15اِسْتَفْعَلَ
Nounsالأسماء
2Mverbal noun (Masdar)مصدر
2Cactive participleاسم فاعل
2Ppassive participleاسم مفعول
2Hhyperbolic participleصيغة مبالغة
2Ssuperlativeاسم تفضيل
2Inoun of utilization (instrumental noun)اسم آلة
2BBroken pluralجمع تكسير
Casesالحالة
3Nnominativeحالة الرفع، مرفوع
3Aaccusativeحالة النصب، منصوب
3Ggenetive, possessiveحالة الجر، مجرور
Derivativesالمشتقات
4Erelative nominal constructمصدر صناعي
4Ddiminutiveصيغة تصغير
4Qnumerative nounاسم مرة
4Hinstance nounاسم هيئة
4Ttemporal nounاسم زمان
4Llocative nounاسم مكان
4Aadjectiveصفة
4Jrelative adjectiveنسبة
4Bpseudoverbal adjectiveصفة مشبهة
4Rinterrogativeاستفهام
4Vadverbحال
4Ppronounضمير
4Upersonal pronounضمير منفصل
4Wrelative pronounإسم موصول
4Mdemonstrative pronounإسم إشارة
4Nproper nounاسم صحيح
4Ztemporal adverbظرف زمان
4Klocative adverbظرف مكان
4Xreflexive pronounضمير
4Spossessive pronoun
4Ccardinal numberالعدد
4Oordinal numberالترتيب
4Fdefiniteمعرف
4Iindefiniteنكرة
Particlesالأدوات
2Cconjunctionعطف، أداة عطف
2Pprepositionحرف جر
2Ddefinite articleأداة تعريف
2Rinterrogativeأداة استفهام
2Nconditionalأداة شرط
2Msimileأداة تشبيه
2Eemphasisأداة توكيد
2Xexclusionالاستثناء
2Iinterjection
2Spostposition
Symbolsالرموز
2Ppunctuationترقيم
2Ccurrencyعملة
2Mmathحساب
2Ddateتاريخ
2Ttimeوقت

acronymبادئة
abbreviationإختصار
Person, Number, Genderالضمائر والعدد والجنس
7, 101first personمتكلم
7, 102second personمخاطب
7, 103third personغائب
8, 11Ssingularمفرد
8, 11Ddualمثنى
8, 11Ppluralجمع
9, 12Mmasculineمذكر
9, 12Ffeminineمؤنث
9, 12Uunisexمستوي الجنس
9, 12Nneuterعديم الجنس

Msound masculine pluralجمع مذكر سالم
Fsound feminine pluralجمع مؤنث سالم
Lcollective nounإسم جمع
Umass nounاسم غير المعدود
Radicalsالجذور
rootجذر
soundصحيح
defectiveمعتل
triconsonontal rootجذر ثلاثي صحيح
quadrilateral rootجذر رباعي
Hamzatedجذر مهموز
geminatedجذر مضعف
Hollow verbفعل أجوف
Weakened verbفعل ناقص
Assimilated verbفعل مثال

Iinitialأولي
Mmedialوسطي
Ffinalطرفي
Ontologyالتكوين
negationالنفي
negativeمنفي
affirmativeمثبت
Ainanimateجماد
Ianimateحي
Ppairedمزدوج
Ooddفردي
Language varietiesاللهجات
13-1410Modern Standard Arabicالعربية الفصحى
Miscellaneousمصطلحات
adverbial phraseحال
subordinateمبتدأ
predicateخبر
diptoteالممنوع من الصرف
genetive constructإضافة
noun phraseجملة اسمية
verbal phraseجملة فعلية
clauseشبه جملة
active sentenceجملة فعلية
Sagent, subjectفاعل
Opatient, objectمفعول
Tintensifier adverbمفعول مطلق
Xexclusionالاستثناء
direct objectمفعول به أول
indirect objectمفعول به ثان
phrasal verb
accusative of vocationمنادى
prepositional phraseجار ومجرور
caseحالة اسم
Nunationالتنوين
modals, invariantsالجوامد
tenseزمان الفعل
moodالحالة الإعرابية
cliticطرف صرفي
procliticبادئة صرفية
encliticخاتمة صرفية
collocationالتلازم
agreementالإتباع اللغوي
affixesالزوائد
prefixالسوابق
infix
suffexesاللواحق
multipart nameاسم مركب
named entitiesهيئة مسماة

Home » MAPS » MAPS Semantics » Arabic Part of Speech Tagset
Category Software | Reference MSLTAG | Family MAPSEMANL | Last updated 28/4/2019