Arabic Part of Speech Tagset "KTagset"

Synopsis

Part of speech tagging is the process of selecting the most likely sequence of syntactic categories for the words in a sentence. It determines grammatical characteristics of the words, such as part of speech, grammatical number, gender, person, etc. In the case of Arabic language, this task is not a trivial one since most of the words are ambiguous as a result of the absence of vowels.

The system uses a special tagset designed for this purpose shown here.

Kalmasoft's Tagset (© KTagset) is the generic tagset for the Arabic PoS Tagger, it is the default tagset used by the system, but many other mappings are available as optional.

A tag is string of twenty two characters grouped in three 4-letters sets and one 10-letters set [4-10-4-4], the 10 letters endss with two digits to indicate the language variety while the rest of letters have their different grammatical notation, each letter may have different representation depending on the set it resides in and the specific position it occupies, basically the tag string is case sensitive and broadly categorized as follows {syntax}{morphology}{semantics}{ontology}.

"يستبدلانكن" => {VIIA}{TA3DM2PF10}{••••}{••••}
ترميز كلماسوفت (KTagset) يستخدم سلسلة من اثنين وعشرين حرفاً موزعة إلى أربعة مجموعات الثانية منها تضم عشرة أحرف تنتهي برقم يبين مستوى اللغة بينما البقية تتألف من أربعة لكل مجموعة، أي حرف في الترميز يأخذ وظيفته بحسب المجموعة وترتيبه داخلها، الترميز مرتب إلى الوظائف التالية (النحو، الإملاء، الدلالة، التكوين).

PositionTagEnglishArabic
1Nnounإسم
1Vverbفعل
1Pparticleأداة
1Ssymbolرمز
1Dnumberرقم
1Lscriptكتابة
1Eentityمعرف
1Xunparsedمجهول
not applicableغير مطلوب
Tensesالأزمان
2Pperfective, pastماض
2Iimperfective, presentمضارع
2Ffutureمستقبل
Moodsالبناء
3Iindicativeمبني على الضم
3Ssubjunctiveمبني على الفتح
3Mimperativeأمر
3Jjussiveمجزوم
3Eemphaticفعل مؤكد
Voicesالصيغة
4Aactive voiceمبني للمعلوم
4Ppassive voiceمبني للمجهول
Transitivityالتعدي
5Iintransitiveلازم
5Ttransitiveمتعد
5Dditransitiveمتعد لمفعولين
5Aambitransitiveمتعد ولازم
Formsالأوزان
61-9Form 1-9فَعلَ, فَعَّلَ, فاعَلَ, أفْعَلَ, تَفَعَّلَ, تَفاعَلَ, اِنْفَعَلَ, اِفْتَعَلَ, اِفْعَلَّ
6A-FForm 10-15اِسْتَفْعَلَ
Nounsالأسماء
2Mverbal noun (Masdar)مصدر
2Cactive participleاسم فاعل
2Ppassive participleاسم مفعول
2Aadjectiveصفة
2Jrelative adjectiveنسبة
2Vpseudoverbal adjectiveصفة مشبهة
2Ddiminutiveصيغة تصغير
2Hhyperbolic participleصيغة مبالغة
2Ssuperlativeاسم تفضيل
2Qnumerative nounاسم مرة
2Ttemporal nounاسم زمان
2Llocative nounاسم مكان
2Inoun of utilization (instrumental noun)اسم آلة
Casesالحالة
3Nnominativeحالة الرفع، مرفوع
3Aaccusativeحالة النصب، منصوب
3Ggenetive, possessiveحالة الجر، مجرور
Derivativesالمشتقات
4Fdefiniteمعرف
4Iindefiniteنكرة
4Rinterrogativeاستفهام
4Vadverbحال
4Ttemporal adverbظرف زمان
4Blocative adverbظرف مكان
4Ppronounضمير
4Upersonal pronounضمير منفصل
4Lrelative pronounإسم موصول
4Ddemonstrative pronounإسم إشارة
4Nproper nounاسم صحيح
4Xreflexive pronounضمير
4Spossessive pronoun
4Ccardinal numberالعدد
4Oordinal numberالعدد
Particlesالأدوات
2Cconjunctionعطف، أداة عطف
2Pprepositionحرف جر
2Ddefinite articleأداة تعريف
2Rinterrogativeأداة استفهام
2Nconditionalأداة شرط
2Msimileأداة تشبيه
2Eemphasisأداة توكيد
2Xexclusionالاستثناء
2Iinterjection
2Spostposition
Symbolsالرموز
2Ppunctuationترقيم
2Ccurrencyعملة
2Mmathحساب
2Ddateتاريخ
2Ttimeوقت

acronymبادئة
abbreviationإختصار
Person, Number, Genderالضمائر والعدد والجنس
71first personمتكلم
72second personمخاطب
73third personغائب
8Ssingularمفرد
8Ddualمثنى
8Ppluralجمع
8BBroken pluralجمع تكسير
9Mmasculineمذكر
9Ffeminineمؤنث
9Uunisexمستوي الجنس
9Nneuterعديم الجنس

Msound masculine pluralجمع مذكر سالم
Fsound feminine pluralجمع مؤنث سالم
Lcollective nounإسم جمع
Umass nounاسم غير المعدود
Radicalsالجذور
rootجذر
soundصحيح
defectiveمعتل
triconsonontal rootجذر ثلاثي صحيح
quadrilateral rootجذر رباعي
Hamzatedجذر مهموز
geminatedجذر مضعف
Hollow verbفعل أجوف
Weakened verbفعل ناقص
Assimilated verbفعل مثال

Iinitialأولي
Mmedialوسطي
Ffinalطرفي
Ontologyالتكوين
negationالنفي
negativeمنفي
affirmativeمثبت
Ainanimateجماد
Ianimateحي
Ppairedمزدوج
Ooddفردي
Language varietiesاللهجات
13-1410Modern Standard Arabicالعربية الفصحى
Miscellaneousمصطلحات
adverbial phraseحال
subordinateمبتدأ
predicateخبر
diptoteالممنوع من الصرف
genetive constructإضافة
noun phraseجملة اسمية
verbal phraseجملة فعلية
clauseشبه جملة
active sentenceجملة فعلية
Sagent, subjectفاعل
Opatient, objectمفعول
Tintensifier adverbمفعول مطلق
Xexclusionالاستثناء
direct objectمفعول به أول
indirect objectمفعول به ثان
phrasal verb
accusative of vocationمنادى
prepositional phraseجار ومجرور
caseحالة اسم
Nunationالتنوين
modals, invariantsالجوامد
tenseزمان الفعل
moodالحالة الإعرابية
cliticطرف صرفي
procliticبادئة صرفية
encliticخاتمة صرفية
collocationالتلازم
agreementالإتباع اللغوي
affixesالزوائد
prefixالسوابق
infix
suffexesاللواحق
multipart nameاسم مركب
named entitiesهيئة مسماة

Home » MAPS » MAPS Semantics » Arabic Part of Speech Tagset
Category Software | Reference MSLTAG | Family MAPSEMANL | Last updated 18/4/2019