|
|
|
Kodlayıcı - Saklama Ortamı - Açıcı: Geçen yüzyılın son çeyreğinde, veri saklama ortamları, sayısal verileri tutabilecek derece hassaslaşmıştır. Sayısal formdaki sinyallerin depolanması bilgisayar ve medya teknolojilerinin ayrılmaz bir parçası haline dönüşmüştür. Doğada değişim süreklidir. Buna insanoğlunun bilgi ve sanat üretiminin de sürekli olması eklenince veri saklama ortamlarının her zaman dolup yetersiz kalması da kaçınılmazdı. Hem iletişim hem depolama endüstrilerinin göz bebeği haline gelen “veri sıkıştırma”, diğer tüm sayısal sinyal işleme (digital signal processing - DSP) çalışmalarının bir adım önüne çıktı. Özellikle ses, video, resim ve müzik taşıyan sinyaller büyük bir sıkıştırma potansiyeli içeriyordu. Öyle ki, yüzlerce üniversite ve araştırma kurumunda binlerce bilim adamı bu konuya adeta saldırdı. Tüm matematiksel modeller ziyaret edildi, tüm istatistik kaleler fethedildi. Ancak itiraftan kaçınmaya gerek yok: alınan yol öyle azdı ki, görünen yola kıyasla sadece “kıpırdadık” diyebiliriz. Bunun üzerine, olduğumuz yerde binalar inşa ettik ve en azında o durağa değer kattık, kullanıma açtık. Bu kente “veri sıkıştırma standardları” diyoruz. Günümüzde cep telefonlarından fotoğraf makinelerine, sayısal televizyonlardan müzik çalarlara kadar hemen her elektronik cihaza değer katan MPEG, JPEG ve ITU standardları bilimsel yenilik açısında 80’li yılların başlarına gün verir. Bu standardlar duyumsal sinyalleri doğal hallerinde yakalayıp, deterministik kurallar ile sayısal formlara çevirmektedir. Neden determinizm? Neden istatistiksel modeller? Bunu tartışmak için veri sıkıştırma sistemlerinin mekanizmalarına göz atmamız gerekecek. Sinyalleri doğal analog hallerinden sayısal hale dönüştürürken karşımıza çıkan ilk engel nicemleme (quantization) aşamasıdır. Sinyalden Nyquist frekansında alınan örneklerin sahip olabileceği değerlerin sayısı sonsuzdur. Bu sebepten, tüm uç sinyal algılayıcıları, edinme (acquisiton) aşamasında örnekleri sonlu sayıda seviyeye nicemler. Bu seviyelerin her birine bir sembol (ör: piksel) atanır. Bu işlem, birden fazla örneğin aynı anda nicemlenmesi ile (vector quantization) daha az sayıda sembol ile daha az kayıplı olarak yapılabilir. Vektörün uzunluğu, yani bir seferde nicemlenen örnek sayısı, arttıkça kazancın da artacağını bize kanıtlayan yine Shannon’dan başkası değildi. Vektörel nicemleyiciye bu gücü kazandıran, ardışık oldukları için benzeşebilen örnekleri aynı sembolün içine almasıdır. Böylece bu benzerlik ileticinin geri kalan işlemlerine yük olmaktan kurtarılır. Zira tahmin edilebilecek tüm benzerlikler enformatik açıdan artık bilgilerdir (redundant information). Benzeşme (similarity) ve ilinti (correlation), tüm veri sıkıştırma algoritmalarının yok etmeye çalıştığı ana hedeftir. Kayıplı sıkıştırma (lossy compression) sistemlerinin temel prensibi veri bloklarının değişimini tahmin edip sadece tahmindeki hataları kodlamaktır. Hem iletici, hem alıcı sıradaki veri öbeğini, o ana kadar gelenleri kullanarak tahmin eder. Daha sonra iletici, orjinal öbek ile tahmin edilen arasındaki farkı kayıplı olarak kodlayıp iletir. Bu fark bilgisi alıcı tarafından yalnızca sıradaki öbeğe son halini vermekte değil, ardından geleceklerin tahmin edilmesinde de kullanılacaktır. İletici ile alıcı arasındaki bu senkronize tahmin operasyonu zaman eksenindeki değişimlere adaptasyonu sağlar. Gerçekte tüm canlılar, algı mekanizmalarında, tahmin suretiyle çevrelerindeki değişimleri süzer ve seçici davranırlar. Bizi çevreleyen doğayı bir karmaşık sistem (complex system) olarak ele alırsak, bu çevrede örüntü tanıma (pattern recognition) yetisinin yaşamsal önem taşıdığı tartışmasızdır. Özellikle canlılar ile cansızları birbirinden ayırmak için simetri ve hareket örüntülerini tanımak, evrim testinden geçen canlıların ortak özellikleridir. Ses, konuşma, müzik, görüntü gibi duyusal sinyallerde tanıma ve tahmin etme işlemleri için sinyalin içerdiği enformasyonu kullanıyoruz. Oysa enformasyon hangi tür sinyal için konu edilirse edilsin, sinyalin kendisi gibi fiziksel bir olgu değildir. Daha ziyade, sinyalin biçimine, içerdiği kalıplara, genel seyrine dair göstergelerden (signs) oluşan bir izlenimdir. Bu durumda etkin yapay tahmin teknikleri geliştirmek için pekçok tahmin yönteminden o anki göstergelere en uygununu ya da en uygun olanlar kümesini seçmek gerekir. Tahmin hatalarını kodlama aşamasında da durum bundan pek farklı değildir. Aslında çevremizdeki karmaşık sistemden, tahmin edebildiğimiz unsurları çıkardığımızda geriye kalan yine bir karmaşık sistemdir. Kodlayıcı için yapılacak tek şey yine örüntüleri yakalayıp, tüm örüntülerin tanımları gereği içerdikleri ilintilerdeki artık bilgiyi çekerek sıkıştırmayı sağlamaktır. Bu karmaşık sistemde var olabilecek örüntüleri, olasılıklarına göre şöyle derecelendirebiliriz:
1. ve 2. derece artıkları daha güçlü, gösterge tabanlı tahmin sistemleri ile eleyebileceğimizi varsayıp, 3. ve 4. dereceler üzerine eğilmek doğru olur. Sağ-duyunun ve çarpıcı durumların gösterge toplama sürecindeki yerini bir düşünce deneyi ile gözleyelim. Deney düzeneği Helsinki kentinin yol kavşaklarına yerleştirilmiş, internet bağlantılı kameralar olsun. Bu kameralar o günkü hava koşullarını gösterge olarak kullanıp doğru kodlama araçlarını seçmektedir. Hava koşulu göstergesi ise bir gün önce sisteme bağlanan kullanıcıların oylarıyla belirlensin. Noel sabahı yapılacak bir deneyde tüm kullanıcıların kar yağışına oy vereceğini tahmin etmek yanlış olmaz. Bununla birlikte bir yaz günü yağmur oylarına az rastlanacaktır. Oysa yaz yağmurları en az karlı Noel sabahları kadar durumlar repertuarında yer almaktadır. Bunun sebebi yaz yağmurlarının, az rastlansalar da “çarpıcı durum” örnekleri olmalarıdır. Göstergeler doğrultusunda kodlama ve tahmin araçlarını belirlerken bir ara basamağı kullanmayı düşünebiliriz. Enformatik göstergelerin birer izlenim olduğundan yola çıkıp bu ara basamakta bir “izleyici” belirlemeliyiz. Bu izleyici bir durum (case) veya örüntü toplayıcı olabilir. Tesbit edilen her gösterge, toplayıcıdaki durumlarla karşılaştırılıp sınıflandırılır. Böylece elde edilen sınıfa en uygun kodlama araçları alt kümesi belirlenip, bunlardan biri kullanılır. Sıkıştırılacak sinyalde, göstergesel bir bütünsellik içeren her örüntü parçası üzerinde en verimli tahmin ve kodlama aracının kullanılması, genel verimi de maksimize edecektir. Araç seçimi için örüntünün göstergeleri kullanılacağından, en verimli seçim için anahtar, gösterge-araç ilişkilendiricisi yani sınıflandırıcı birimi olacaktır. Toplananların da birbirleri ile ilişkilendirilmesi ve organize bellek haritalarına dönüştürülmesi sınıflandırma kararlarını kolaylaştıracaktır. Hatta bir adım daha atıp yeteri sıklıkta yinelenen göstergelere dair kararları otomatikleştirip, daha üst seviyede karar mekanizmalarına bağlamayı düşünebiliriz. Bu noktaya kadar kavramsal olarak doğru ve cazip görünen fikirlerin pratik sistemlere dönüştürülmesinde sorunlar çıkacağına kuşku yok. Bunların en tehditkarı, tüm uyarlanır sistemlerin (adaptive systems) ortak sorunu “iletici-alıcı senkronizasyonu” olacaktır. Bir de bu iletici ve alıcıları çalıştıracak cihazların bellek ve işlem hızları yetersiz kalabilir. Bu iki sorunu da en kolay yoldan aşmak için internet teknolojileri kullanılabilir mi? Hem ileticiler hem alıcılar istemci-sunucu (client-server) mimarisi ile hazırlanırsa yerel şebekeye bağlanacak bir sunucu, gösterge çıkarma, sınıflandırma, bellek modellerini saklama, kodlama araçlarını belirleme işlemleri için paylaşılacak bir kaynağa dönüşebilir. Bu sunucular da bir ana sunucuya bağlanma yoluyla küresel çapta biriktilecek bilgiyi kullanabilirler, repertuarlarını aynı anda tazeleyebilirler. Son bilimsel çalışmalarla yapay sağduyu ve örüntü tanıma alanlarında önemli aşamalar kaydedilmiştir. Çarpıcı bir örnek vermek gerekirse, Cyc Bilgi Bankası’nı gösterebiliriz. Yapay bir sağ-duyu, anlam ve çıkarım veritabanı olan Cyc, uygulamalara anlamsal (semantic) yorum yetisini kazandırmayı hedefliyor. Standardlaştırdığı mesajlaşma formatı ile uygulamalar Cyc Knowledge Server ile konuşup, tanıma, sınıflandırma ve ilişkilendirme süreçlerine sağ-duyu katabilirler. Diğer bir delil olarak, NEC’in sanal kitaplığı ResearchIndex’de bulunan milyonlarca yayın arasında en çok okunan ilk 10’un 8’inin örüntü tesbiti, tanınması ve sınıflandırılması konusuyla doğrudan ya da dolaylı ilgili olması gösterilebilir. Karmaşık sistemlerle ilgili çalışmalar ise özellikle Santa Fe Enstitüsü’nün katkılarıyla egzotik bir bilim dalı olmaktan çıkıp, organizasyon gerektiren pratik sistemlerde yer almaya başlamıştır. Saklamak ya da iletmek amacıyla sinyallerin sayısallaştırılmasının iki ana sebebi, hatalara karşı dayanıklılık katabilmek ve sıkıştırıp artık verilerden arındırabilmektir. Enformatik açıdan ise sinyalleri kaynaklarından ve izleyicilerinden bağımsız düşünemeyiz. Oysa enformasyon, günümüzde, bu öznel çabasını yitirmiştir. Bilgiyi atomize edip küçük mesajlara dönüştürdüysek suçu, “binary information unit -bit”leri tanımlayıp, ilk defa kullandığı için Bay Shannon’a atamayız. Enformasyon matematiksel niceliklerle ifade edildiği sürece anlamsal içerik kaybolacaktır. Günümüzde bilgi teknolojileri bilgiden ziyade sinyaller, veriler gibi fiziksel olgularla ilgilidir. Doğa ile bütünleşik sistemler kurmak ve olası verimin tümünü elde edebilmek için, bilgiye öznel varlığını geri vermemiz gerekiyor. Şimdiye kadar üretilen sıkıştırma araçlarını gözden çıkarmak istemediğimize göre, onları anlamsal çözümleme yeteneğine sahip sistemlerde kullanmak çıkar bir yoldur. Enformasyonu henüz cihazlar tarafından edinme aşamasında sinyaller yerine anlamsal bütünlüğü olan sembollerle ifade etmeliyiz. Bu semboller birer ihbar, birer gösterge kabul edilip hem tahmin hem tahmin hatası kodlama aşamalarında doğru araçların seçilebilmesini sağlamalıdır. Böyle uyarlanır, sürekli öğrenen sistemler yeni iletişim kentlerine giden yol olacaktır. Yazıyla ilgili görüş ve yorumlarınızı
yorum@teknoTurk.org ve AliTurker@garanti.com.tr
adreslerine
yollayabilirsiniz.
|