jawiware

latest update: 26/8/2009 12:13:54 PM

contact: zamri@ftsm.ukm.my

Laman mengandungi beberapa perisian dan penulisan berkaitan jawi.

This web pages contain a few softwares and papers related to jawi.

لامن ويب اين مڠاندوڠي ببراڤ ڤرايسين دان ڤنولسن تنتڠ جاوي

( You need to have arabic typesetting font to have the jawi above display correctly. If you do not have this font, the system would use Arial, which produce a rather "ugly" display )

All things provided in a hope it would be useful for learning jawi. All copyright retained by UKM

keywords: jawi , transliterasi , perisian, peraturan

Menulis jawi di PC

Menulis jawi di komputer peribadi adalah senang. Anda perlukan;

  1. Papan kekunci jawi. muat-turun jawi-layout. Anda boleh mereka layout sendiri dengan MSKLC.
  2. font yang mengandungi huruf jawi. fon untuk jawi.
  3. perisian yang menyokong penulisan kanan-ke-kiri seperti notepad.exe, MS WORD , dan OpenOffice (percuma).
  4. Pastikan komputer anda menyokong penulisan right-tol-left, seperti XP/Vista dan Window 7.
  5. Sekiranya anda menggunakan Linux atau Mac OS, kaedahnya agak berbeza.
  6. Anda tidak perlu menggunakan sebarang perisian istimewa seperti multikey.

rumi-jawi transliteration engine

* inspired by http://ejawi.net

There are currently 2 online rumi-system available;

  1. ejawi.net
  2. TERUJA at Fakulti Teknologi Sains Maklumat

This engine uses spelling rules as mentioned by DBP ( Daftar Kata Bahasa Melayu: rumi-sebutan-jawi ) to transliterate rumi to jawi. Based on a sample data of 2500 most frequently malay words, its has roughly 70% accuracy. More tests are needed, for instance for various KVK, KVKV, etc patterns.

This is but one way of doing transliteration. There are ways such as pattern mapping and bayesian/probability approach.

Good: it can transliterate any rumi words, doesn't depend on korpus. Thus, you always get something back. You can transliterate names, places or even english words.

It is written using C# and WPF, and works on Vista. For XP/Vista, you need to install .net framework 3.5 and WPF.

Bad: 65-70% accuracy, due to rules for spelling arabic words, e pepet, e taling, and other spelling rules.

You need to download 2 items;

  1. rumi-jawi-transliteration engine
  2. kamus rumi-jawi based on DBP, not complete

Kamus diperlukan dalam menguji ketepatan sistem. Pengguna boleh menambah data dalam kamus ini.

( asalnya data jawi bukan dalam bentuk UNICODE, oleh itu sukar untuk cut-dan-paste pada aplikasi ). Pastikan kamus menggunakan "comma" untuk memisahkan rumi dan jawi. Gunakan editor UNICODE seperti notepad.exe

font jawi (Arabic Typesetting) that support jawi characters, if you don't have it already.

latest (6/6/2009): Window 7 add another font that have jawi. Sakkal Majalla

rumi-jawi based on korpus

This rumi-jawi transliteration is based on rumi-jawi korpus. The basic idea is to have a small system to allow users to learn writing jawi. Currently the system have about 2,541 malay words , mostly taken from the weekly Utusan Melayu.

It is written using C# and WPF, and works on Vista. For XP, you need to install .net framework 3.5 and WPF.

Good: 100% accurate, it based on your korpus. you can add new words to the corpus using unicode editor. Please see the corpus.

Bad: need to prepare jawi korpus, and can only transliterate rumi words that exist on korpus.

You need to download;

  1. perisian rumi-jawi-korpus New version 27/4 ( embedded font )
  2. korpus rumi-jawi korpus 2541 perkataan (6/5/2009)

rumi-jawi syncronize transliteration.

small modification to the above application. Write in the top panel, syncronize jawi would appear in the bottom two panels. The middle panel use rules, the bottom panel use corpus.

You need to download;

  1. rumi-jawi sync
  2. rumi-jawi korpus 2541 perkataan

jawi font viewer

Use to see fonts that supports jawi on your system. Will upload later, seem to misplace the binary.(26/8/2009

Jawi keyboard layout

A modified arabic(saudi arabia) keyboard layout to allow users to enter jawi characters.

چ ڠ ݢ ۏ ڤ ڽ

The basic idea: change the diacritical marks ( fatha, kasra, damma, sukun, tanween, etc) into the six extra jawi characters.

Papan kekunci jawi. muat-turun

  1. jawi-layout.

A proposed keyboard layout based on input from SIRIM DBP, UKM is available at http://ejawi.net.

Anda boleh mencipta/merubah papan-kekunci anda dengan menggunakan perisian msklc.

Latest info 22/3/2009.

Satu proposal untuk jawi layout telah dibincang dan dicadangkan oleh beberapa pihak ( DBP, SIRIM, UKM, MyNIC ). Papan ini mempunyai layout sama dengan papan arab sa_AR, dengan kedudukan shift untuk huruf-huruf jawi.

My own keyboad layout. jawi keyboard layout.

Nama papan kekunci ( cadangan ) ar_MY. ( based on ISO naming convention

that follow the sequence of language_territory )

Rasional: ar_ ( arabic, dalam pemprosesan ar_ akan menunjukkan RTL ( right-to-left direction ). Kita perlu guna ar_ kerana komputer perlu tahu ia memproses dokumen RTL. Dalam dunia, hanya bahasa ar_ guna RTL.

MY_ : location/territory.

Untuk bahasa melayu, the code adalah ms_MY. Kenapa tidak jw_MY atau nama lain, kenapa guna ar_? Kerana kita ikut piawai ISO.

Jawi spelling checker

In theory, jawi spelling checker has 2 componet;

  1. spell check
  2. suggestion

In the first mode, the system would check if the jawi words is correctly spelled or not. This is relatively easy to implement. The main issue is speed and the size of the jawi dictionary.

In order to implement this, you have to have a jawi wordlist, stored in hashed or array or dictionary. The system would check the user words with the words in the wordlist. If the user words is not in the list, then we found a spelling error.

The difficult part is, if we found an error, what are the words to suggest? again, there are many ways, and each has its own benefits. A few method is distance edit, random permutation and regex approach. The key is to get as accurate as possible to the correct words.

Unicode-compliant jawi font

Many of the current fonts that support arabic doesn't have the extra fonts to write jawi. Thus, there are a need to have Unicode-compliant jawi fonts.

One font that support jawi are arabtype.ttf ( untuk pengguna Vista ).

Satu lagi font untuk jawi, Scherezade.

Satu fon yang digunakan untuk menulis quran dari King Fard Quran Printing Complex, Madinah. Satu font yang cantik, tapi sayang tidak mempunyai beberapa huruf jawi. Ia dihasilkan oleh Uthman Taha, seorang penulis caligrafi arab yang terkenal. King Fard Quran Printing Complex (KFQPC)fon

Special Issue: the position of hamzah

Hamzah ء dalam penulisan jawi mempunyai beberapa hukum. Dalam keadaan biasa, hamzah ditulis 3/4 dari baris asas. Namum, tiada fon yang menyokong penulisan sedemikian semasa ini.

Oleh itu, anda boleh menggunakan subscript untuk menaikkan hamzah ء pada kedudukan yang betul.

22/4/2009. Satu cadangan untuk menambah huruf 'hamzah 3/4' akan dikemukakan untuk pertimbangan UNICODE.

position of hamzah(pdf)


ZWNJ - Zero width non joiner

Terdapat beberapa keadaan dimana ZWNJ diperlukan, umpamanya untuk perkataan teks, sains dan golf. Huruf

س
tidak bersambung dengan huruf sebelumnya. Ini memerlukan penggunaan ZWNJ.

Lazimnya, pengguna menggunakan space untuk menjarakkan perkataan jawi tersebut.

Contoh:
  1. تيک س‌
  2. تيکس‌‌

Perhatikan, ejaan teks yang melibatkan huruf

س
yang tidak bersambung dengan
س
dipisahkan dengan "space".

Penggunaan "space" akan menghasilkan huruf yang agak jauh kedudukannya.

jawi : Encoding and Rendering

Encoding is how a character is saved and transmitted in computer. For instance, the UNICODE encoding for (alif)

ا
is 0627.

There are many encoding exists, but today most of the computing world accept UNICODE as the standard for characters encoding.

Rendering is how the characters is display on the computer. This involves 2 technology: font and rendering engine. Read the article below.

Engin renddering pada window adalah usp10.dll

Perhatikan keputusan untuk dua versi usp10.dll;

  1. versi 1.4 (window XP)
  2. versi 1.4 (window Vista)

Perhatikan perbezaan penggunaan engin render yang berbeza. Pada versi 1.4, huruf ݢ tidak boleh disambungkan dengan huruf-huruf sebelum dan selepas.

Banyak pengguna menggunakan kaf-arab, sedangkan jawi menggunakan kaf-farsi. Namun, kerana kesulitan teknnologi, penggunaan kaf-arab banyak digunakan dalam media cetak.

Bagaimana menukar usp10.dll. tukar usp10.dll

Penulisan

  1. jawi keyboard.

    Cadangan layout jawi. supersede dengan cadangan MyNIC/DBP/UKM/SIRIM pada 24/4/2009.

  2. jawi font

    Article about some Unicode compliant jawi fonts. The survey indicate the need to have a locally produce jawi fonts.

  3. keyboard jawi - normal

  4. keyboard jawi - shift

Rujukan jawi

  1. Panduan menulis dan mengeja jawi: hamdan abdul rahman, DBP.

    Secara kebetulan, Tuan Haji Hamdan merupakan guru besar di Sekolah Menengah Sains Kelantan pada masa saya tingkatan 1 pada tahun 1978. Betapa kecilnya dunia ini!

  2. Pandai Jawi: Matlob
  3. Sejarah aksara jawi: Amat Johari Muin, DBP
  4. Sejarah perkembangan tulisan jawi: Hashim Musa, DBP
  5. Daftar Kata Rumi-Jawi(2008)