Japonca çok baytlı kodlamanın temelleri
Japonca karakterler sadece çok baytlı karakter kodlaması ile gösterilebilir
ve çok baytlı kodlama standartlar platforma ve kullanılan metnin amacına göre
değişir. Daha da kötüsü bu kodlama standartları birbirlerinden oldukça
farklıdır. Bir geliştirici, Japonca bir ortamda kullanılabilecek bir HTTP
uygulaması oluşturulurken doğru karakter kodlamalarını kullanabilmek için bu
karmaşayı iyi bilmek zorundadır.
-
Altı bayta kadar bayt içerebilen karakterlerin saklanması
-
Çoğu Japonca çok baytlı karakter tek baytlı karakterelerin iki katı
genişliktedir. Bu karakterlere Japonca'da "zen-kaku" denir ve
"tam geniş" anlamına gelir. Dar olanlarına ise
"han-kaku" denir ve "yarı geniş" anlamına gelir.
Karakterlerin çizgesel özellikleri, bunları göstermekte kullanılan yazı
tiplerine bağlıdır.
-
Bazı karakter kodlamaları, belli bir kod bölgesine (00h
.. 7fh) geçmek için ISO-2022 ile tanımlanmış kaydırma
(öncelem) dizilimleri kullanır.
-
SMTP/NNTP için ISO-2022-JP kullanılmalı; başlıklar ve öğeler RFC
gereksinimlerine uygun olarak yeniden kodlanmalıdır. Bunlar elzem olmasa
da çoğu kullanıcı aracı başka kodlama yöntemi tanımadığından bunları
kullanmak daha iyidir.
-
» i-mode veya
» EZweb gibi taşınabilir telefon
hizmetleri için oluşturulan sayfaların Shift_JIS kullandıkları varsayılır.
-
PHP 5.4.0 itibariyle, » i-mode
veya » EZweb gibi taşınabilir telefon
hizmetleri için resim-yazı (pictogram) karakterleri desteklenmektedir.