Dil Kodlaması Nedir?
(Son güncelleme- Şubat 2008)
Kodlama, genel anlamda; belirgin nesnelerin istenen ortamda tanımlanabilmesi ve tanınabilmesi için önceden kararlaştırılmış özgün bir biçimde tanımlanmasıdır. Kodlamanın en bilinen örneğini 1830larda oluşturulmuş olan ‘mors alfabesi’nde görürüz. Örneğin iki kısa vuruş ’i’ harfini gösterir.
Bilgisayarlar ilke olarak sadece sayılarla işlem yaparlar. Sözcüklerin ve yazı karakterlerinin her biri için birer sayı atarlar ve o şekilde saklarlar. Bilgisayarlarla ilgili ilk Kodlama 1960lı yılların başında ASCII (bugün de kullanılmaktadır) ve EBCDIC ile başlamıştır.
Dünyada Hangi Dil Kodları Var
Dünyada 2,500-3,000 arası dil olduğu söylenmektedir. İnternette bugün kullanılabilen (kullanılan) dil adedi 34 ile sınırlıdır. İkinci Kuşak kodlamayı geliştiren Unicode (Tekkod) Konsorsiyumu ise bugünedek (Şubat 2008) 52 Dilde İnternet kullamını sağlayacak kodlamayı geliştirmiştir.
Değişik alfabe ve yazım kuralları gerektiren bu dillerin arasında ilişki kurmak ve Bilgisayar Ekranında gerektiğinde istenen dili göstermek karmaşık bir işlemdir. Bugün dünyada bir Dil Kodlaması bolluğu vardır. Bu kodları genel olarak iki gruba ayırabiliriz;
a. Eski Kuşak- Bölgelere göre geliştirilmiş değişik kodların kullanılması.
b. Yeni Kuşak- Evrensel, bütün dil ve işaretleri kapsayan tek bir kodlama sistemi.
Eski kuşağa örnek olarak; ISO 8859’un yayınlanmış ve herbiri yaklaşık 60 İsviçre Frank’ına satılan 10 adet Standartının yanında Windows Sistemi- Basit Çince(GB18030); Basit Çince(GB2312); Basit Çince(HZ); Geleneksel Çince(Big5)’ in de arasında bulunduğu yaklaşık 50 değişik kodlama sistemini sayabiliriz .
Yeni kuşağa örnek ise ikisi de birbirinin aynı olan ISO 10646 ve Tekkod(Unicode)dur.
Bugün Türkçe kullananlar için 2 seçenek vardır;
Eski Kuşak: Türkçe-ISO ve Türkçe-Windows (15 senedir var, artık yenilenmiyor)
Yeni Kuşak: Tekkod (UTF-8). (Geleceğin sistemi, kullanımı hızla yayılıyor. Yakında herkes kullanacak ve kullanılan tek sistem olacak)
Şu An Siteler Hangi Kodlamayı Kullanıyor
Aşağıda sunulan çok kısa bir derleme Türkiyede ve dünyada kullanılan sitelerle ilgili kodlama durumunu vermektedir.(Temmuz-Ağustos 2006) Örnekleme belirli kıstaslarla yapılmadığı için sonuçlar sadece bir gösterge olarak alınmalıdır !!
Özetle: Tekkod’un ilk Standart’ı 1993 yılında çıkmasına rağmen, ülkemizde Türkçe ISO 8859 ve onun uzantısı Windows sürümleri Site Yapımlarında % 95 oranında kullanılmaktadır. Tekkod kullanımı %5’tir.
ABD hemen tümüyle ASCII’yı bırakmış ve uluslararası kullanıma uygun Tekkod’a geçmiştir. Ayrıca daha da ileri bir teknik uyguluyorlar. Bazı Siteler Türkiye’den açılırken Tr-Win olarak açılıyor. (USA Today- Gazete) Diğer ülkelerde ise Tekkod kullanımı genelde %25 oranında kullanılmaktadır.
Rastlantı olarak şu olayı gördüm. Moğolistan’da bir site; http://www.mongoliatoday.com/ kodlama olarak Tr-Win kullanmış. Aslında olur, Tr-Win içinde bütün ASCII harfleri var, İngilizce olan sitenin gereksimini karşılıyor. Sanırım orada çalışan bir Türk elindeki kod’u kullandı, site normal çalışıyor.
tablo
Dil Koduna Nasıl Bakılır, Değiştirilir
a. Microsoft Outlook’ta Dil Kodu Belirleme
b. Gelen Mesajların Dil Koduna Bakma ve Değiştirme
c. İnternet Sitelerinin Dil Koduna Bakma
Buraya kadar sabredip, okuyan sayın ilgili;
LÜTFEN EKSİK GÖRDÜĞÜNÜZ YER/KONU VARSA BİLDİRİR MİSİNİZ?
(Beğendi iseniz bildirmenize gerek kalmıyor, çünkü bu yazı sizin beğenmeniz ve yararlanmanız için hazırlandı.)
Böyle bir bilgi aktarımınızdan dolayı çok teşekkür ederim. Çoğu zaman bahsettiğiniz karmaşık yazılarda ne yapacağımı bilemediğimden gelen mailleri okumadan siliyordum. Bundan sonra sayenizde gelen mailleri okuyacağımı ümid ederim. Büyük bir boşluğu doldurduğunuzdan dolayı Tekrar teşekkürler.
[...] “Karakter Kodlaması” olarak bilinen detayın ne olduğu hakkında bilgi sahibi olmak isteyenler BURAYA tıklayabilirler. İyi çalışmalar diliyorum. Gönderen Server Acim konu başlığı: [...]