Bilgi Sonrası Çağda Dil Modelleri: Düşüncenin Yeniden İnşası

Tarih:

Dil modelleri, bilgiyle ilişkimizde derin bir dönüşüm yaratıyor; basit teknolojik araçlar olmaktan çıkarak  bilginin kaynağına, otoritesine ve doğruluk ölçütlerine dair yerleşik algımızı yeniden tanımlıyor. Bir dil modelinin ürettiği yanıtların kaynağını sorguladığımızda çağdaş bilginin doğasıyla yüzleşiriz: O bilgi hiçbir yerden gelmiyor — ama aynı zamanda her yerden geliyor. Söz konusu modeller, milyarlarca metni olasılık dağılımları hâline getirir ve her seferinde metni yeniden inşa ederek, bilginin kökenini sayısız kaynağa yayar; bu nedenle hiçbir yanıt tek bir kaynağa ait değildir. Bilgi-sonrası (post-epistemik) çağda bilginin değeri kaynak güvenilirliği ile değil; tutarlılık, kullanılabilirlik ve bağlamsallıkla ölçülür. Buradaki dönüşümü kavrayabilmek için bilgi teknolojilerinin tarihsel evrimine bakmak gerekir; çünkü her teknolojik sıçrama yalnızca bilgiye erişimi değil, düşünme biçimimizi de dönüştürmüştür.

EPİSTEMOLOJİK DÖNÜŞÜMÜN ARKEOLOJİSİ

Gutenberg’in matbaası, bilgiyi özgürleştiren bir devrim yaratırken aynı zamanda doğrusal ve hiyerarşik bir düşünce biçimini de yerleşik hale getirdi. Basılı metnin, yalnızca bilgiyi taşıyan bir araç olmanın ötesinde düşüncenin de belirleyicisi haline dönüşmesi, sahip olduğu fiziksel yapı —sayfaların baştan sona okunmasını gerektiren lineer yapı, paragrafların ardışıklığı—ile doğrudan ilişkilidir. McLuhan’ın belirttiği gibi, matbaa teknolojisi ve zihinsel süreçlerimiz standardize olurken; bilgi sabit, tekrarlanabilir ve ölçülebilir bir forma bürünerek—her kitap, her nüshada aynı kelimeler, aynı sırayla, aynı sayfalarda yer aldı.[1] Matbaanın getirdiği bu sabit ve doğrusal bilişsel yapı, dijital devrimle birlikte çok daha akışkan bir modele evrildi.

İnternetle birlikte bilgiye erişim sörf yapma eylemine dönüştü.[2] Bilgi doğrusal bir sırada değil, hiperlinklerle örülmüş çok boyutlu bir ağ içinde var olmaya başladı. Kullanıcılar, metinleri baştan sona okumak yerine ilgilerini çeken kavramlara tıklayarak sayfalar arasında dolaşmaya başladılar. Böylece her biri, ilgi alanları ve rastlantılarla şekillenen kendi okuma rotasını oluşturabildi.

Erişim ortamlarının dönüşümüyle birlikte bilgi, hiyerarşik ve merkezi bir yapıdan ağsal ve dağıtık bir düzene geçti. Yine de internetin merkeziyetsiz doğası, bilginin belirli kaynaklara dayanması gerektiği varsayımını tamamen ortadan kaldıramadı. Örneğin, Wikipedia’da her içerik düzenlenmiş, kaynaklandırılmış ve bir topluluk tarafından onaylanmış metinlere dayanır. Bilgi, kaynaksız olmamakla birlikte akışkan ve ağsaldır; ancak sorumluluk hâlâ belirli bireylere ve kurumlara atfedilir. Sürekli müzakere edilen bilgi, referans noktalarına bağlı kaldığı, hibrit bir epistemolojik alanın temsilcisidir. Foucault’nun episteme kavramıyla benzer biçimde, internet çağının epistemesi de bilginin hangi koşullarda doğru sayılabileceğini tanımlar.[3] İnternet, merkeziyetçiliği çözse de, kaynak kavramını meşruiyetin temel ölçütü olarak korumaya devam eder.

DİL MODELLERİ VE BİLGİNİN BULUTLAŞMASI

Dil modelleri, bilginin üretimini kökten dönüştürüyor. Bilgi tek bir öznenin ürünü olmaktan çıkarak; medya, algoritmalar, kullanıcılar ve veri akışları arasındaki etkileşimden doğan dinamik bir süreç hâline gelir. İnsan ve insan-olmayan aktörlerin birlikte işlediği bir ekolojik ağda, bilgi, çoklu etkileşimlerin ürünü olan bir ekosistem olarak yeniden tanımlanır.[4]

Dil modellerinin kaynaksız olduğu elbette tartışmalıdır; sonuçta eğitim verileri, insan eliyle üretilmiş gerçek metinlerden oluşur. Ancak burada belirleyici epistemolojik fark şudur: Belirli bir kitaptan yapılan alıntı, doğrulanabilir bir kaynağa dayanır. Oysa milyarlarca metnin istatistiksel örüntülerinden anlık olarak türetilen bir çıktı, hiçbir tekil kaynağa geri götürülemez.

Bu süreçte transformer mimarisi ve dikkat mekanizmaları (attention) kritik bir rol oynar.[5] Model, bir metindeki her kelimenin diğer tüm kelimelerle ilişkilerini eşzamanlı olarak hesaplar; böylece tüm bilgi parçaları aynı anda, paralel olarak konuşur. Bir kelimeye odaklandığında, model bağlamın tamamını anlık olarak değerlendirir ve insan bilişinin sıralı yapısını aşan paralel, çok katmanlı bir anlama biçimi ortaya çıkar. Böyle bir yapı, sorumluluk ve sahipliğin belirgin olduğu klasik bilgi süreçlerinden radikal biçimde ayrılır; çünkü burada hem sahiplik hem de sorumluluk, olasılık bulutu içinde dağılır. Sonuçta bilgi, artık sabit bir şey değil, sürekli yeniden oluşan, akışkan bir süreç hâline gelir.

Bilgi üretim süreçleri, tarihsel olarak üç aşamalı bir dönüşümle açıklanabilir: Matbaa bilgiyi tek yönlü, akışkan, ama belirli bir yatağı takip eden nehre dönüştürdü; internet, bu nehri okyanusa çevirerek kullanıcıların linklerden linklere dalga dalga ilerlemesine olanak tanıdı; dil modelleri ise okyanusu bulutlara çeviriyor: Bilgi artık sabit değil, her kullanıcının ihtiyacına göre yeniden yoğuşan, metin, görsel, ses ve video gibi modaliteleri birleştiren akışkan bir bulut hâline geldi.

Bulutlaşma, bilgiyi depolanan bir nesne olmanın ötesinde, tetiklendiğinde ortaya çıkan potansiyel bir süreç olarak konumlandırır. Erişim, basit bir aramadan, mevcut potansiyeli harekete geçiren bir diyaloğa dönüşür; sürekli oluşan, sınırları belirsiz ve çoklu bakış açılarıyla şekillenen bir yapıdır. Sabit anlam yerine bağlama göre şekillenen, doğru bilgi yerine olasılıksal bir düzen ortaya çıkar; bilgi, insan ve insan-olmayan aktörlerin birlikte ürettiği kolektif bir epistemolojiye evrilir. Dönüşümün arkasındaki teknik mekanizmayı anlamak, epistemolojik kaymayı kavramak için elzemdir.

Dil modelleri metinleri kelime kelime okumaz; devasa bir vektör uzayında, kelimelerin hangi bağlamlarda birlikte göründüğünü izler. Her kelime ve kavram, belirli bir koordinata sahip bir vektör hâline gelir ve anlam, vektörler arasındaki mesafe ve yön ilişkileriyle belirlenir. Örneğin model, “kral” ile “kraliçe” arasındaki ilişkinin, “erkek” ile “kadın” arasındaki ilişkiye benzediğini fark eder.[6] Bunu tanımlardan değil, milyarlarca cümledeki kullanım örüntülerinden çıkarır. Öğrenme eylemi, gömme uzayı (embedding space) olarak adlandırılan çok boyutlu matematiksel bir alanda gerçekleşir; benzer anlamlı kelimeler birbirine yakın konumlanır.

Buradaki yakınlık, insan temelli kategorilerden bağımsızdır: Kelimelerin benzer bağlamlarda birlikte kullanıldığını model tarafından tespit edilir. Örneğin, “kral” − “erkek” + “kadın” işlemi “kraliçe” vektörünü verir. Süreç, bilinç veya niyet olmadan, tamamen istatistiksel uyuma dayalı olarak anlam ilişkilerini kavrar. Sonuçta bilgi, ilişkisel ve bağlamsal bir düzlemde var olur. Bu olasılıksal üretim, kelimelerin anlamını da dönüştürür; dil modeli için bir kelime, sabit bir tanım değil, bağlamla sürekli yeniden şekillenen bir anlam düğümüdür.

EPİSTEMOLOJİK KAYMA VE HALÜSİNASYON

Dil modelleri kesin doğrular üretmek yerine, milyarlarca metinden çıkarılan olasılık dağılımlarına, bağlamsal uyuma ve tutarlılığa göre çalışır. Modellerin yapısal özellikleri, kaçınılmaz bir yan etkiyi de beraberinde getirir: halüsinasyon. Diğer bir tanımla, gerçekte var olmayan ya da eğitim verisinde yer almayan bilgilerin, model tarafından son derece mantıklı ve inandırıcı bir dille aktarılması durumu. Halüsinasyon basit bir hata olmanın ötesinde, modelin işleyiş mantığının organik bir uzantısıdır. Çünkü model, gerçeği aramak için değil, dizideki bir sonraki en olası tokeni bulmak üzere eğitilmiştir. Eğitim verisindeki tutarsızlıklar, belirsizlikler veya gürültüler, tahmin sürecini gerçeklikten uzaklaştırabilir. Model, eğitim boyunca karşılaştığı milyarlarca veri parçasından örüntüler çıkarır ve bunları yeni bağlamlarda birleştirir. Yetenek, yaratıcılık ile yanılsama aynı düzlemde buluşur—başarı ile hata arasındaki sınır, muğlak kalır.

Bilginin değer ölçütü kaynaktan kopup tutarlılık ve kullanışlılık zeminine kaydığında tehlikeli bir alan açılır: Yeni düzenin bilgisi, ideolojik manipülasyonlara savunmasızdır ve gerçek, piyasa değeriyle alınıp satılan bir enstrümana dönüşme riskiyle karşı karşıya kalır. Çünkü, bilgi-sonrası çağda doğru veya yanlış yerini, işlevsel veya işlevsiz olana bırakır. Bir yapay zekânın ürettiği etkileyici bir metin, gerçeği yansıtmıyor olsa bile, bir tartışmayı başlatabilir, bir duyguyu tetikleyebilir veya bir yaratıcı sürece ilham verebilir. Bilginin değeri, temsiliyetinde değil, etkisinde yatar.

ETKİ, UYUMLAMA VE ETİK ÇERÇEVE

Uyumlama (alignment) kavramı bir gereklilik olarak ön plana çıkar: Dil modelini insan değerleriyle uyumlu hâle getirme çabası. Dil modellerinin eğitim sürecinin son aşaması olan İnsan Geribildirimiyle Pekiştirmeli Öğrenme (RLHF), yukarıda bahsedilen kaymayı kurumsallaştıran teknik süreçtir.[7][8] Süreç şu aşamalardan oluşur: İlk olarak, model bir soru veya görev için birden fazla çıktı üretir. Ardından insan değerlendiriciler çıktıları karşılaştırır ve hangisinin daha iyi olduğunu seçer. Değerlendiricilerin tercihleri bir ödül modeli oluşturmak için kullanılır—modelin hangi tür çıktıların ödüllendirildiğini öğrenmesi için bir puanlama sistemi. Son aşamada ise dil modeli, ödül modelini maksimize edecek şekilde yeniden eğitilir; yani artık olası değil, ödüllendirilen çıktıları üretmeye yönelir.

Modelin teknik mimarisindeki kritik epistemolojik kayma şu noktada ortaya çıkar: İnsan değerlendiriciler iki çıktıyı karşılaştırırken çoğunlukla doğruluk yerine tercih ölçütlerini dikkate alır. Bir çıktı, gerçeği daha iyi yansıttığı için değil; daha akıcı, güvenli, tatmin edici veya kurumsal talimatlara uygun olduğu için seçilir. Model böylece, ne ürettiğinin doğruluğunu değil, ürettiği şeyin hangi bağlamlarda kabul göreceğini öğrenir. Değerlendiricinin “bu daha iyi” şeklindeki tercihi, aslında bir doğruluk beyanı değildir; çoğunlukla çıktının daha az riskli, ikna edici veya kurumsal standartlarla uyumlu olmasına dayanan pragmatik bir karardır. Sonuç olarak, RLHF halüsinasyonu tamamen ortadan kaldırmaz; yalnızca bazı biçimlerini sınırlar. Bazı halüsinasyonlar hata olarak işaretlenirken, bazıları yaratıcı veya uygun olarak kabul edilebilir.

Bilgi-sonrası çağda doğruluk ölçütü yerini işlevselliğe ve etik uyuma bırakır; bilgi artık temsiliyetle değil, etkisi ve yönlendiriciliği ile değer kazanır. Dil modellerinin halüsinasyon yeteneği ile RLHF’nin etik ve epistemik yönlendirmesi birleştiğinde, bilgi ve iktidar arasındaki ince çizgi daha görünür hâle gelir. Üretilen metinler gerçeği yansıtmasa da toplumsal, kültürel ve bilişsel süreçleri şekillendirebilir; başarı ile hata, gerçek ile tercih, doğruluk ile etik arasındaki sınır belirsizleşir. Yeni düzende bilgi, temsil gücünü yitirip bir etki, yönlendirme ve etik kontrol aracıdır.

Etik ve bilişsel sonuçları henüz tam olarak görünür olmayan, toplumsal bir dönüşümdeyiz. Ancak bir şey çok net: Bilginin ne olduğuna, nasıl üretildiğine ve kimin tarafından sahiplenildiğine dair tüm varsayımlarımız köklü bir sorgulamadan geçiyor. Yeni epistemolojik düzende neyin kabul edilebilir olduğuna, hangi değerlerle ve hangi güç ilişkileri içinde kim karar verecek? Bilginin bulutlaşması özgürleştirici bir potansiyel taşırken, aynı zamanda epistemik ve etik kontrol mekanizmalarının görünmezleşmesi riskini de beraberinde getirir. İşte tam da bu noktada, dil modellerinin mimarisi ile toplumsal yapılar arasındaki ilişkiyi sorgulamak, yalnızca teknik bir mesele değil, aynı zamanda politik ve felsefi bir zorunluluk hâline gelir.

Kaynakça

[1] Marshall McLuhan, The Gutenberg Galaxy: The Making of Typographic Man (Toronto: University of Toronto Press, 1962).

[2] Burada aslında World Wide Web’i kastediyoruz; ancak kolaylık açısından “internet” demeyi sürdüreceğiz.

[3] Michel Foucault, The Archaeology of Knowledge (New York: Pantheon Books, 1972).

[4] Donna Haraway, Staying with the Trouble: Making Kin in the Chthulucene (Durham, NC: Duke University Press, 2016).

[5] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Łukasz Kaiser ve Illia Polosukhin, “Attention Is All You Need,” arXiv, 2017, https://arxiv.org/abs/1706.03762.

[6] Tomas Mikolov, Kai Chen, Greg Corrado ve Jeffrey Dean, “Efficient Estimation of Word Representations in Vector Space,” arXiv, 2013, https://arxiv.org/abs/1301.3781.

[7] Paul Christiano, Jan Leike, Tom Brown, Miljan Martic, Shane Legg ve Dario Amodei, “Deep Reinforcement Learning From Human Preferences,” arXiv, 2017, https://arxiv.org/abs/1706.03741.

[8] (ing) Reinforcement Learning from Human Feedback

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

Editörün Seçtikleri

Yazar Olmak İstiyorum

Yeni ve güçlü akademik kadromuzla yayın hayatına başlayan Republica, Sosyoloji, Felsefe, Tarih ve Politika alanlarında kalemini konuşturmak isteyen yazarlara kapılarını açıyor!

İlgini Çekebilir
SOCIUS

Bedenin Zirvesi: Direnişin Politik Ontolojisi

Bu çalışma, dağcılık ve Marksizm kavramlarıyla yaşam, beden ve...

Antik Mısır Mitolojisi – Catherine Chambers | Tanıtım: Bahar Çetiner

Hep bir anlam ararız. Neden var olduğumuza, nereden gelip...

Popülizmin Gerçek Yönü: Aşağıdan Değil, Yukarıdan

Bir toplumsal fenomeni anlamak istiyorsak, önce onun ne olmadığını...

Henri Bergson’da Zaman ve Hafıza

Henri Bergson, felsefe tarihinde daha önce pek de üzerine...