Construction  |   Business  |   Government  |   Agriculture  |   Health  |   Education  |   Geolocation  |   Justice  |   Industry  |   Security  |   Language  |   Sport  |   Office  |   Transport
PERSONAL NAMES  |   PLACE NAMES  |   ENTITY NAMES  |   ACRONYMS  |   ENTITY ACRONYMS  |   SEMANTICS  |   ORTHOGRAPHY  |   ONTOLOGY

Arabic Part of Speech Tagset "KTagset"

Synopsis

Part of speech tagging is the process of selecting the most likely sequence of syntactic categories for the words in a sentence. It determines grammatical characteristics of the words, such as part of speech, grammatical number, gender, person, etc. In the case of Arabic language, this task is not trivial since most of the words are ambiguous as a result of the absence of vowels.

The system uses a special tagset designed for this purpose.

Kalmasoft's Tagset (© KTagset) is the generic tagset for the Arabic PoS Tagger, it is the default tagset used by the system, but many other mappings available in the system.

A tag is string of twenty characters grouped in three quartets and one octet [4-8-4-4], each character may have different representation depending on the quartet/octet it resides in and the specific position it occupies, basically, the tag string is case sensitive and broadly categorized as follows {syntax}{morphology}{semantics}{ontology}.

"يستبدلانكن" => {VIIA}{103DM2PF}{xxxx}{----}
ترميز كلماسوفت (KTagset) يستخدم سلسلة من عشرين حرفاً موزعة إلى أربعة مجموعات الثانية منها تضم ثمانية أحرف بينما البقية تتألف من أربعة لكل مجموعة، أي حرف في الترميز يأخذ وظيفته بحسب المجموعة وترتيبه داخلها، الترميز مرتب إلى الوظائف التالية (النحو، الإملاء، الدلالة، التكوين).

PositionTagEnglishArabic
1Nnounإسم
1Vverbفعل
1Pparticleحرف
1Ssymbolرمز
1xunparsedمجهول

2Pperfective, pastماض
2Iimperfective, presentمضارع
2Ffutureمستقبل

3Iindicativeمبني على الضم
3Ssubjunctiveمبني على الفتح
3Mimperativeأمر
3Jjussiveمجزوم
3Eenergeticفعل المؤكد

4Aactive voiceمبني للمعلوم
4Ppassive voiceمبني للمجهول

Iintransitiveلازم
Ttransitiveمتعد
Dditransitiveمتعد لمفعولين
Aambitransitiveمتعد ولازم

71first personمتكلم
72second personمخاطب
73third personغائب
8Ssingularمفرد
8Ddualمثنى
8Ppluralجمع
8BBroken pluralجمع تكسير
9Mmasculineمذكر
9Ffeminineمؤنث
9Uunisexمستوي الجنس
9Nneuterعديم الجنس

2Cactive participleاسم فاعل
2Ppassive participleاسم مفعول
2Aadjectiveصفة
2Rproper adjectiveصفة منسوبة
2possessive pronoun
2reflexive pronounضمير
2Upersonal pronounضمير منفصل
2pronounضمير
2Otemporal adverbظرف زمان
2Blocative adverbظرف مكان
2Finfinitiveمصدر
2Lrelative pronounإسم الموصول
2Ddemonistrative pronounإسم الإشارة
2Qnoun of timeاسم المرة
2Tnoun of timeاسم الزمان
2Enoun of placeاسم المكان
2Inoun of instrumentاسم الآلة
2Kcardinal numberالعدد
2Sordinal numberالعدد
2Nproper nounاسم صحيح

3Ddefiniteمعرف
3Iindefiniteنكرة
3Rinterrogativeالاستفهام
3Ssuperalitiveصيغة التفضيل
3Mdiminutiveصيغة تصغير
3Eصيغة مبالغة

4Nnominativeحالة الرفع، مرفوع
4Aaccusativeحالة النصب، منصوب
4Ggenetive, possesiveحالة الجر، مجرور

Msound masculine pluralجمع المذكر السالم
Fsound feminine pluralجمع المؤنث السالم
Lcollective nounإسم الجمع
Umass nounاسم غير المعدود
Tintensifier adverbمفعول مطلق
Xexclusionالاستثناء

2Cconjunctionعطف، أداة عطف
2Pprepositionحرف جر
2Ddefinite articleأداة التعريف
2Spostposition
2Iinterjection
2Xexclusionالاستثناء

2Ppunctuationترقيم
2Ccurrencyعملة
2Mmathحساب

3Ppairedمزدوج
3Ooddفردي

4Iinitialأولي
4Mmedialوسطي
4Ffinalطرفي

rootجذر
soundصحيح
defectiveمعتل
triconsonontal rootجذر ثلاثي صحيح
quadrilateral rootجذر رباعي
Hamzatedجذر مهموز
geminatedجذر مضعف
Hollow verbالفعل الأجوف
Weakened verbالفعل الناقص
Assimilated verbالفعل المثال

adverbial phraseحال
subordinateمبتدأ
predicateخبر
diptoteالممنوع من الصرف
genetive constructإضافة
noun phraseجملة اسمية
verbal phraseجملة فعلية
clauseشبه الجملة
active sentenceجملة فعلية
Sagent, subjectفاعل
Opatient, objectمفعول
direct objectمفعول به أول
indirect objectمفعول به ثان
phrasal verb
منادى
prepositional phraseجار ومجرور

caseحالة الاسم
Nunationالتنوين
modals, invariantsالجوامد
tenseزمان الفعل
moodالحالة الإعرابية
cliticطرف صرفي
procliticبادئة صرفية
encliticخاتمة صرفية
collocationالتلازم
agreementالإتباع اللغوي
affixesالزوائد
prefixالسوابق
infix
suffexesاللواحق
multipart nameاسم مركب
named entitiesهيئة مسماة

negationالنفي
negativeمنفي
affirmativeمثبت
acronymبادئة
abbreviationإختصار
Ainanimateجماد
Ianimateحي

Facts

Home » MAPS » MAPS Semantics » Arabic Part of Speech Tagset
Category Software | Reference MSLTAG | Family MAPSEMANL | Last updated 16/4/2016