Construction  |   Business  |   Government  |   Agriculture  |   Health  |   Education  |   Geolocation  |   Justice  |   Industry  |   Security  |   Language  |   Sport  |   Office  |   Transport
PERSONAL NAMES  |   PLACE NAMES  |   ENTITY NAMES  |   ACRONYMS  |   ENTITY ACRONYMS  |   SEMANTICS  |   ORTHOGRAPHY  |   ONTOLOGY

Orthography - Arabic Text Diacritizing System

Synopsis

MAPS suite also has orthographic component come in the four modules shown below, some of which are being developed, however, output samples are available for download as PDF for your convenience, you are also encouraged to send us your sample input for processing free of charge, we accept limited size samples in any form or encoding.


MAPSOrtho Family MembersRelated DatabasesOther software of interest
Arabic Text Diacritizer Arabic Corpus Personal Names Retrieval System
Arabic Noun Inflector Database of Arabic Roots Arabic Part of Speech Tagger
Arabic Text Stemmer Database of Arabic Stems Arabic Text Parser
Arabic Verb Conjugator Database of Loan Words Geographical Names Romanizer
Arabic Lemmatizer Database of Loan Terms  
  Database of Colloquial Arabic  
  Database of English/Arabic Entity Names  

Arabic is one of the UN official languages and is read from right-to-left; Arabic language has an inflectional system that is known for its rich vocabulary and complex morphology. The Arabic Abjad consists of twenty eight letters, twenty five of which are consonants and the remaining three letters are long vowels. A distinguishing feature of Arabic is that no letters are used to represent short vowels. Instead, they are represented by short strokes called diacritics, which are placed either above or below the preceding consonant.

Another feature is that Arabic text is written unvocalized except for classical themes and Koranic text, this is a major stumbling stone for any NLP system. Kalmasoft diacritizing module is developed to accomplish full and semi-vocalization process of the raw input text.


MAPS orthographic processor
A screenshot of the MAPSOno interface, you can view the technical specifications. You may also DOWNLOAD Evaluation copy.


Raw input text
اعتمد صاحب السمو الشيخ الدكتور سلطان بن محمد القاسمي عضو المجلس الأعلى حاكم إمارة الشارقة والرئيس الأعلى لجامعة الشارقة أمس أسماء الطلاب والطالبات المقبولين في جميع كليات الجامعة لفصل الخريف الدراسي القادم (2008-2009م)، وبلغ العدد الإجمالي للطلبة المقبولين إلى الآن 1960 طالبا وطالبة في جميع كليات الجامعة عدا كلية المجتمع بمراكزها المختلفة والتي ستعلن نتائج القبول فيها في الأيام القليلة القادمة، وبلغ عدد الطلبة المقبولين في كليتي الطب وطب الأسنان 150 طالب وطالبة في كل منها، بينما التحق 100 طالبا وطالبة في كلية الصيدلة، و564 طالبا وطالبة في كلية الهندسة، و80 طالبا وطالبة في كلية الفنون الجميلة والتصميم، 220 طالبا وطالبة في كلية القانون، وما زال باب القبول مفتوحاً لبعض برامج الجامعة التي لا يزال بها طاقة استيعابية لفصل الخريف القادم، ومنها البرامج المستحدثة أخيراً في كليتي العلوم والمجتمع

Unvocalized KATS version
Aotmd SAHb Alsmw Al$yK Aldktwr slTAn bn mHmd AlqAsmy oDw Almjls Al!olY HAkm EmAr: Al$Arq: wAlreys Al!olY ljAmo: Al$Arq: !ms !smA' AlTlAb wAlTAlbAt Almqbwlyn fy jmyo klyAt AljAmo: lfSl AlKryf AldrAsy AlqAdm (2008-2009m), wblg Alodd AlEjmAly llTlb: Almqbwlyn ElY Al|n 1960 TAlbA wTAlb: fy jmyo klyAt AljAmo: odA kly: Almjtmo bmrAkzhA AlmKtlf: wAlty stoln ntAEj Alqbwl fyhA fy Al!yAm Alqlyl: AlqAdm:, wblg odd AlTlb: Almqbwlyn fy klyty AlTb wTb Al!snAn 150 TAlb wTAlb: fy kl mnhmA, bynmA AltHq 100 TAlbA wTAlb: fy kly: AlSydl:, w564 TAlbA wTAlb: fy kly: Alhnds:, w80 TAlbA wTAlb: fy kly: Alfnwn Aljmyl: wAltSmym, 220 TAlbA wTAlb: fy kly: AlqAnwn, wmA zAl bAb Alqbwl mftwHAN lboD brAmj AljAmo: Alty lA yzAl bhA TAq: AstyoAby: lfSl AlKryf AlqAdm, wmnhA AlbrAmj AlmstHdx: !KyrAN fy klyty Alolwm wAlmjtmo

Vocalized output text
اعْتَمَدَ صَاحِبُ السُّمُوِّ الشَّيْخُ الدكتور سُلْطَان بنْ مُحَمَّد القَاسِمِيّ عُضْوِ المَجْلِسِ الأعْلَى حَاكِمِ إمَارَةِ الشَّارِقَةِ والرَّئِيسِ الأعْلَى لِجَامِعَةِ الشَّارِقَةِ أمْسَ أسْمَاءَ الطُّلابِ والطَّالِبَاتِ المَقْبُولِينَ فِي جَمِيعِ كليات الجَامِعَةِ لِفَصْلِ الخَرِيفِ الدِّرَاسِيّ القَادِمِ (2008-2009م)، وَبَلَغَ العَدَدُ الإجْمَالِيُّ للطَّلَبَةِ المَقْبُولِينَ إلى الآن 1960 طَالِباً وَطَالِبَة فِي جَمِيعِ كليات الجَامِعَةِ عَدَا كلية المُجْتَمَعِ بِمَرَاكِزِهَا المُخْتَلِفَةِ والتِي سَتُعْلَنْ نَتَائِجُ القَبُولِ فِيهَا فِي الأيَّامِ القَلِيلَةِ القَادِمَةِ، وَبَلَغَ عَدَدُ الطلبة المَقْبُولِينَ فِي كليتي الطِّبِ وطِبِّ الأسْنَانِ 150 طَالِبٌ وَطَالِبَة فِي كُلٍّ مِنْهَا، بَيْنَمَا التَحَقَ 100 طَالِباً وَطَالِبَة فِي كلية الصيدلة، و564 طَالِباً وَطَالِبَة فِي كلية الهندسة، و80 طَالِباً وَطَالِبَة فِي كلية الفُنُونِ الجَمِيلَةِ والتَّصْمِيمِ، 220 طَالِباً وَطَالِبَة فِي كلية القانون، وَمَا زَالَ بَابُ القَبُولِ مَفْتُوحَاً لِبَعْضِ برامج الجَامِعَةِ التي لا يَزَالُ بِهَا طَاقَةٌ اسْتِيعَابِيَّةٌ لِفَصْلِ الخَّرِيفِ القَادِمِ، وَمِنْهَا البرامج المُسْتَحْدَثَةِ أخِيرَاً فِي كليتي العُلُومِ وَالمُجْتَمَعِ

Vocalized KATS version
Ao&tamada SaAHibu Als~umuw~i Al$~ay&Ku Aldktwr sul&TaAn bn& muHam~ad AlqaAsimiy~ ouD&wi Almaj&lisi Al!o&laY HaAkimi EmaAra:i Al$~aAriqa:i wAlr~aeiysi Al!o&laY lijaAmioa:i Al$~aAriqa:i !m&sa !s&maA'a AlT~ulAbi wAlT~aAlibaAti Almaq&buwliyna fiy jamiyoi klyAt AljaAmioa:i lifaS&li AlKariyfi Ald~iraAsiy~ AlqaAdimi (2008-2009m), wabalaga Aloadadu AlEj&maAliy~u llT~alaba:i Almaq&buwliyna ElY Al|n 1960 TaAlibAN waTaAliba: fiy jamiyoi klyAt AljaAmioa:i oadaA kly: Almuj&tamaoi bimaraAkizihaA AlmuK&talifa:i wAltiy satuo&lan& nataAeiju Alqabuwli fiyhaA fiy Al!y~aAmi Alqaliyla:i AlqaAdima:i, wabalaga oadadu AlTlb: Almaq&buwliyna fiy klyty AlT~ibi wTib~i Al!s&naAni 150 TaAlibU waTaAliba: fiy kul~I min&haA, bay&namaA AltaHaqa 100 TaAlibAN waTaAliba: fiy kly: AlSydl:, w564 TaAlibAN waTaAliba: fiy kly: Alhnds:, w80 TaAlibAN waTaAliba: fiy kly: Alfunuwni Aljamiyla:i wAlt~aS&miymi, 220 TaAlibAN waTaAliba: fiy kly: AlqAnwn, wamaA zaAla baAbu Alqabuwli maf&tuwHaAN libao&Di brAmj AljaAmioa:i Alty lA yazaAlu bihaA TaAqa:U As&tiyoaAbiy~a:U lifaS&li AlK~ariyfi AlqaAdimi, wamin&haA AlbrAmj Almus&taH&daxa:i !KiyraAN fiy klyty Alouluwmi waAlmuj&tamaoi

Facts

Home » MAPS » MAPS Orthography » Arabic Text Diacritizing System
Category Software | Reference MRLDIAC | Family MAPSORTHO | Last updated 26/12/2013