Tekkod-(Unicode)

Tekkod- (Unicode) Nedir?

Tekkod
hangi altyapı,
hangi yazılım,
hangi dilde olursa olsun,

herbir yazı karakterini özgün bir sayı ile tanımlar.

İlke olarak, bilgisayarlar sadece sayılarla işlem yaparlar. Harflere ve diğer yazı karakterlerinin her birine  birer sayı atarlar ve böyle saklarlar. Tekkod geliştirilmeden önce, bu sayıları atamak için yüzlerce şifreleme yöntemi vardı. Ancak hiç bir kodlama yeterince harfi kapsayamıyordu örneğin; Avrupa Topluluğu bünyesindeki tüm ülkelerin dillerini kapsamak için birkaç kod kullanılıyordu.  Sadece İngilizce dilinde kullanılmakta olan  bütün harfleri, noktalama işaretlerini ve teknik sembolleri kapsayan tek bir kodlama yöntemi de bulunmamaktaydı. Ayrıca mevcut kodlama  yöntemleri kendi aralarında da çelişmekteydi. İki farklı kodlama, aynı sayıyı iki farklı karaktere verilmiş ya da farklı sayılar aynı karakterle gösterilmiş olabilirdi.  Bilgisayarlar, özellikle sunucular ise, birçok kodlamayı  desteklemek zorundadırlar; çelişkili ortamlarda veriler, farklı ortamlardan   geçerken bozulma riski taşırlar. (1)

Tekkod – Unicode’un Kısa Tarihçesi
Batı Dünyası 1947’de küreselleşme programının bir parçası olarak Standartları hazırlama ve onama yetkisini Cenevre’de yerleşik ISO’ya  (“iso” okunur.   Uluslarası Standartlar Kurumu- İngilizcesi International Standards Organization olup ISO olarak kısaltılmıştır) vermiştir.

Bilgisayar Teknolojisi gelişmeye başlayınca ISO önce ISO 639’u, ardından ISO 8859’u çıkarmaya başladı.  ISO 8859 dilleri bölgesel olarak alıyordu. 1980lerin sonuna gelindiğinde sayısı 50ye yaklaşan Dil Kodlama Standartlarını tek bir çatı altında toplamaya karar verildi ve ISO 10646 üzerinde çalışılmaya başlandı. ISO bu yeni kod sistemini UCS (Evrensel Karakter Takımı) olarak adlandırdı.

ISO 10646-1 ilk olarak 1993’te yayınlandı. 2003’te tek bir standart olarak tekrar yayınlandı.  Yeni harf ve işaret sürekli olarak eklenmekle beraber, ilke olarak bugün geçerli olan ISO 10646ya eklenti yapılabilir, fakat tanımlanmış olan karakterler dondurulmuştur, değiştirilemez.   Tekkod sistemindeki  gelişmelere uyumlu olarak ISO 8859 artık tekrar basılmamak üzere donduruldu. (2)

ISO Uluslararası bir kurum olarak bu çabayı sürdürürken ABD’de işe pratik olarak yaklaşan bazı firmalar (önce Xerox, ardından Apple) 1987 yılında özgün, evrensel ve düzenli bir kodlama, Unicode‘u (Tekkod) hazırlamaya başladılar.  (3)

1990’lı yılların başında Batı’nın önemli bir özelliği olan “uzlaşma” ilkesi çalışmaya başladı ve ISO ile Unicode Konsorsiyumu bir araya geldi.  İki taraf ilke olarak, “her iki grubun da özerk olarak çalışmaya devam etmesine, fakat önerilen gelişme ve değişikliklerin her iki kodlamada da tıpa tıp aynı olmasına “ karar verdiler.

Bunun sonucu olarak Tekkod-1.1 (Unicode) ile  ISO-10646-1 (1993) birbirinin aynıdırlar. Varılan uzlaşma sonucu UTF kısaltma ismi de doğdu. Bugün pratikte kullanılan kodun adı “Unicode UTF-8”dir.  UTF’nin açılımı;

U= UCS – İngilizce Universal Character Set (Evrensel Karakter Takımı)’nın U’su, (*)

T= Dönüşüm (Transfer)

F= Biçem (Format)

“Evrensel Dönüşüm Biçemlemesi” dir.

UTF’nin tanımı;  “Her bir Tekkod Kod noktasının algoritmik olarak özgün bir bayt sıralamasına bağlanması” dır. UTF-8,  ABD’de Eylül 1992’de bir akşam yemeğinde düşüncesini masa örtüsünü kullanarak  açıklayan Ken Thompson tarafından geliştirilmiştir.

Her ikisi de aynı bilgileri veren ISO 10646,  ISO’dan 112 İsviçre Frangına alınabilir veya internetten bedelsiz olarak indirilebilir. (82 MB)   Unicode 5.0 ise piyasadan 45 USD’ye alınabilir.

Tekkod’un Bugünkü  Durumu

Tekkod bugün büyük bir hızla  ASCII, ISO 8859 ve EUC (AB Kodları)’nın yerini almaktadır. Tekkod sadece bir Dil Kodlaması olmayıp, her türlü matematik ve teknik simgelerini de tanımlamaktadır.   Tekkod aynı zamanda Unix kullanıcıları için tek kaynaktır ve bundan dolayı Çin’de çok yaygın biçimde kullanılmaktadır.

UCS (Evrensel Karakter Takımı) bilinen bütün dilleri  kapsamaktadır. Dil listesi Latince, Yunanca, Kiril , İbranice, Arapça, Ermenice ve Gürcüce alfabelerinin yanında; Çin, Japon, Kore Han, Hiragana, Katakana, Hangul, Bengal, Tamil, Kmer, Tibet, Etiyopya, Çeroki, Moğol, Myanmar vs. dillerinin harf ve işaretlerini de kapsamaktadır.  Tekkod tanımlamasının ilerde Hiyeroglif’i de kapsamına alması planlanmıştır.

UTF ile UCS aynı anlama gelip, aynı işlevi görmektedir.  UTF-8 internette en çok kullanılan kodlamadır. UTF-16 Java ve Windows uygulamaları için kullanılmaktadır. UTF-32 ise genelde Unix işlemleri için kullanılmaktadır.  Değişik UTF’ler arasında geri dönülebilir dönüşüm yapılabilir.  Konsorsiyum bugün çalışmalarını az kullanılan diller üzerinde sürdürmektedir.

Tekkod ve ISO 10646 Arasında Ne Fark Vardır

Bugün Tekkod Konsorsiyumu tarafından yayınlanan Tekkod (Unicode) Standardı  ile ISO 10646 arasında uygulama alanında hiçbir fark yoktur. Her iki standartta da karakterler;  aynı yerde,  aynı özellikte ve aynı isimdedirler.

Tekkod ek olarak, dildeki karakterlerin anlamı üzerinde daha derin araştırma yapıp, bilgi vermektedir.  Tekkod aynı zamanda kullanıcıya yönelik olarak çeşitli kolaylık yöntemleri  sağlamaktadır.

(*)   U harfinin sadece Unicode’un kısaltması olduğu da söyleniyor. O zaman  Türkçe açılımı  Tekkod  Dönüşüm  Biçemlemesi  olurdu.

(1)    http://www.unicode.org/standard/translations/turkish.html

(2)    www.iso.org

(3)    www.unicode.org

Yazı Sonu

sekiz washington 537 de

Tekkod-(Unicode) için 4 cevap

  1. gultekinorhon diyor ki:

    Buraya kadar sabredip, okuyan sayın ilgili;

    LÜTFEN EKSİK GÖRDÜĞÜNÜZ YER/KONU VARSA BİLDİRİR MİSİNİZ?

    (Beğendi iseniz bildirmenize gerek kalmıyor, çünkü bu yazı sizin beğenmeniz ve yararlanmanız için hazırlandı.)

  2. Çağ Onganer diyor ki:

    Referans vererek yazdığınız için teşekkür ederim. Tekkod yazılım şirketlerinin ender olarak buluşuğu ortak bir noktadır.

  3. alper diyor ki:

    elinize saglik tesekkur ediyorum…

  4. Tekkod.com gururla yorum yapıyor ve makale paylaşımına devam ediyor

Bir Cevap Yazın

Aşağıya bilgilerinizi girin veya oturum açmak için bir simgeye tıklayın:

WordPress.com Logosu

WordPress.com hesabınızı kullanarak yorum yapıyorsunuz. Log Out / Değiştir )

Twitter resmi

Twitter hesabınızı kullanarak yorum yapıyorsunuz. Log Out / Değiştir )

Facebook fotoğrafı

Facebook hesabınızı kullanarak yorum yapıyorsunuz. Log Out / Değiştir )

Google+ fotoğrafı

Google+ hesabınızı kullanarak yorum yapıyorsunuz. Log Out / Değiştir )

Connecting to %s

%d blogcu bunu beğendi: