Toponymy - Geographical Names Arabicization System


MAPSTopo is the family name of our toponymy processing package; a set of specialized modules tuned for applications such as information retrieval, document clustering, named entity extraction (NER), and translation. Output samples are available for download as PDF for your convenience, you are also invited to send us your sample input for processing free of charge, we accept limited size samples in any form or encoding.

Arabicizing multilingual place names
A direct Arabicization of geographical name is straightforward with Kalmasoft Arabicizer if the input is written in native script, the name's inherent phonemic characteristics are kept through various stages of Arabicization process. This system is based on thorough listing of language phonetic rules that are used to Arabicize place names from 50 different languages, place names can be input in their original script or as romanized version where improvement to Arabicization process is done through pattern matching and other accuracy measurments used for Arabicization.

The system supports more than 50 languages in input: Oromo, Afar, Afrikaans, Amharic, Armenian, Assamese, Bengali, Bulgarian, Burmese, Catalan, Chinese, Czech, Danish, Dutch, Esperanto, Finnish, French, Gaelic, German, Greek, Gujarati, Hebrew, Hindi, Indonesian, Interlingua, Irish, Italian, Japanese, Korean, Kurdish, Malayalam, Marathi, Pashto, Persian, Portuguese, Romanian, Russian, Spanish, Somali, Swahili, Swedish, Telugu, Thai, Tigrinya, Turkish, Ukrainian, Urdu, Yiddish, Yoruba, Tigre, Filipino, Tamazight, Meroitic.

The system uses a database for geographical names that come in different orthographies and have multiple exonyms e.g. Egypt, Cairo.

MAPSTopo Arabicizer functional diagram
MAPS Name Arabicization
A screenshot of the MAPSTopo interface, you can view the technical specifications. You may also DOWNLOAD Evaluation copy.

  The sample given below contains multilingual text. Without proper rendering support, you may see question marks, boxes, or other symbols instead of the correct intended characters, you may either get the suitable fonts from our lingual support page or download the PDF version for which no extra arrangement is required, you may also view a larger sample here Arabicized place name database

ID Entry KATS Arabic Language Variants
00001 Στάγειρα stAgyyrA ستاغييرا el
00002 Στρατονίκεια strAtwnykyyA ستراتونيكييا el
00003 Στρογγυλή strwggwly ستروغغولي el
00004 Στρυμόνας strwmwnAs ستروموناس el
00005 Στυξ stwK ستوخ el
00006 Σύβαρη swbAry سوباري el
00007 Σύβοτα swbwtA سوبوتا el
00008 Σύμη swmy سومي el
00009 Τανάιδα tAnAydA تانايدا el
00010 Τάραντας tArAntAs تارانتاس el
00011 Ταρκύνιοι tArkwnywy تاركونيوي el
00012 Ταρσός tArsws تارسوس el
00013 Τάρταρος tArtArws تارتاروس el
00014 Τάρτησσος tArtyssws تارتيسسوس el
00015 עכו okA عكا he
00016 עפולה obwlh عبوله he
00017 ערד ord عرد he
00018 אריאל AryAl اريال he
00020 אשדוד A$dwd اشدود he
00021 אשקלון A$qlwn اشقلون he
00023 בת ים bt ym بت يم he
00024 באר שבע byr $bo بير شبع he
00025 בית שאן byt $An بيت شان he
00026 בית שמש byt $m$ بيت شمش he
00027 ביתר עילית bytr oylyt بيتر عيليت he
00029 בני ברק bny brq بني برق he
00030 דימונה dymwnh ديمونه he
00031 אילת إylAt إيلات he
00032 אלעד Alod العد he
00033 גבעת שמואל jbot $mwAl جبعت شموال he
00034 גבעתיים jbotyym جبعتييم he
00035 חדרה Hdrh حدره he
00036 חיפה Hybh حيبه he
00037 הרצליה hrzlyh هرزليه he
00038 הוד השרון hwd h$rwn هود هشرون he
00039 חולון Hwlwn حولون he
00040 ירושלים !wrw$lym أوروشليم he
00041 כפר קאסם kfr qAsm كفر قاسم he
00042 כרמיאל krmyAl كرميال he
00043 כפר סבא kfr sbA كفر سبا he
00044 כפר יונה kfr ywnh كفر يونه he
00045 קריית אתא qryAt AtA قريات اتا he
00046 קריית ביאליק qryAt byAlyq قريات بياليق he
00047 קריית גת qryAt jt قريات جت he
00048 קריית מלאכי qryAt mlAky قريات ملاكي he
00049 קריית מוצקין qryAt mwSqyn قريات موصقين he
00050 קריית אונו qryAt Awnw قريات اونو he
00051 קריית שמונה qryAt $mwnh قريات شمونه he
00052 קריית ים qryAt ym قريات يم he
00053 לוד lwd لود he
00054 מעלה אדומים molh Adwmym معله ادوميم he
00056 מעלות-תרשיחא molwt tr$yHA معلوت ترشيحا he
00057 מגדל העמק mjdl homq مجدل هعمق he
00058 מודיעין עילית mwdyoyn oylyt موديعين عيليت he
00060 מודיעין-מכבים-רעות mwdyoyn mkbym rowt موديعين مكبيم رعوت he
00061 נהריה nhryh نهريه he
00062 נצרת nSrt نصرت he
00063 נצרת עילית nSrt oylyt نصرت عيليت he
00064 נשר n$r نشر he
00065 נס ציונה ns Sywnh نس صيونه he
00066 נתניה ntnyh نتنيه he
00067 נתיבות ntybwt نتيبوت he
00068 אופקים Awbqym اوبقيم he
00069 אור עקיבא Awr oqybA اور عقيبا he
00070 אור יהודה Awr yhwdh اور يهوده he
00071 פתח תקווה btH tqwwh بتح تقووه he
00072 קלנסווה qlnswh قلنسوه he
00073 רעננה ronnh رعننه he
00074 רהט rht رهت he
00075 רמת גן rAmAt jn رامات جن he
00076 רמת השרון rAmAt h$rwn رامات هشرون he
00077 רמלה rmlh رمله he
00078 רחובות rHwbwt رحوبوت he
00079 ראשון לציון rA$wn lSywn راشون لصيون he
00080 ראש העין rA$ hoyn راش هعين he
00081 צפת Sbt صبت he
00083 שדרות $drwt شدروت he
00084 שפרעם $brom شبرعم he
00085 טמרה tmrh تمره he
00086 טייבה tyybh تييبه he
00087 תל אביב tl Abyb تل ابيب he
00088 טבריה tbryh تبريه he
00089 טירה tyrh تيره he
00090 טירת כרמל tyrt krml تيرت كرمل he
00091 אום אל-פחם !m AlfHm م الفحم he
00092 יבנה ybnh يبنه he
00093 יהוד-מונוסון yhwd mwnwswn يهود مونوسون he
00094 יקנעם yqnom يقنعم he
00095 Борисоглебск bwryswglybsk بوريسوغليبسك ru
00096 Бородино bwrdynw بورودينو ru
00097 Боровичи bwrwfyty بوروفيتي ru
00098 Боровск bwrwfsk بوروفسك ru
00099 Борзя bwrzy بورزي ru
00100 Братск brAtsk براتسك ru
00101 Бронницы brwnnytk بروننيتك ru
00102 Брянск brynsk برينسك ru
00103 Будённовск bwdywnnwfsk بوديوننوفسك ru
00104 Бугульма bwgwlkm! بوغولګمأ ru
00105 Новочеркасск nwfwtyrk!ssk نوفوتيركأسسك ru
00106 Новодвинск nwfwdfynsk نوفودفينسك ru
00107 Новохопёрск nwfwKwbywrsk نوفوخوبيورسك ru
00108 Новокубанск nwfwkwb!nsk نوفوكوبأنسك ru
00109 Новокуйбышевск nwfwkwybk$yfsk نوفوكويبګشيفسك ru
00110 Новокузнецк nwfwkwznytk نوفوكوزنيتك ru
00111 Новомичуринск nwfwmytwrynsk نوفوميتورينسك ru
00112 あおきむら !wkmrA أوكِمُرا jp
00113 あおもりけん !!mwrkyn أوُمورِكين jp
00114 あおもりし !!mwr$y أوُمورِشِي jp
00115 あかいがわむら !kAygAwAmrA أكايغاوامُرا jp
00116 あかいわし !kAywA$y أكايواشِي jp
00117 あかしし !kA$$y أكاشِشِي jp
00118 あがのし !gAnw$y أغانوشِي jp
00119 あかびらし !kAbrA$y أكابِراشِي jp
00120 あがまち !gAmAt$y أغاماتشِي jp
00121 あかむら !kAmrA أكامُرا jp
00122 つべつちょう tswbytswt$yw تسُوبيتسُوتشِيو jp
00123 つまごいむら tswmAgwymُrA تسُوماغويمُرا jp
00124 つやまし tswyAmA$y تسوياماشِي jp
00126 つるおかし tswr!kA$y تسُورُأُكاشِي jp
00127 たいじちょう tAyjt$yw تايجِتشِيو jp
00128 だいせんし dAysyn$y دايسينشِي jp
00129 だいせんちょう dAysynt$yw دايسينتشِيوأ jp
00130 たいとうく tAytw!k تايتوأُكُ jp
00131 だいとうし dAytw!$y دايتوأُشِي jp
00132 たいないし tAynAy$y تاينايشِي jp
00133 たいわちょう tAywAt$yw تايواتشِيو jp
00134 たかいしし tAkAy$$y تاكايشِشِي jp
00135 たかおかし tAkAwkA$y تاكاوكاشِي jp
00136 たかぎむら tAkAgmrA تاكاغِمُرا jp
00137 たかさきし tAkAsAk$y تاكاساكِشِي jp
00138 たかさごし tAkAsAgw$y تاكاساغوشِي jp
00139 たかしまし tAkA$mA$y تاكاشِماشِي jp
00140 たがじょうし tAgAjyw!$y تاغاجِيوأُشِي jp
