Yapay Zeka Resmen Bir Çıkmaza Girdi ve Sonuçları Felaket Olacak

Álvaro Quintana

Geçtiğimiz aylarda ve yıllarda yapay zeka etrafındaki olağanüstü bir abartı vardı. Örneğin, bir veya iki yıl içinde arabaların tamamen kendi kendine süreceği, YZ'nin gelecek yıl insan zekasını aşacağı ve 2040 yılına kadar bir milyar YZ destekli robot ordusunun insan işçilerin yerini alacağı gibi vaatler vardı. YZ'nin gelişimi durdurulamaz bir üstel yörüngedeymiş gibi görünüyordu. Ancak bu, gerçeği yansıtmıyor. YZ, azalan getiriler tavanına ulaşmaya başladı ve bu büyük vaatleri içi boş hale getiriyor. Bu makalede, YZ'nin karşı karşıya kaldığı sınırları inceleyeceğiz.

Önemli noktaları göster

YZ, gelişiminde azalan getirilere yaklaşıyor, bu da abartılı gelecek projeksiyonlarını gerçekçi olmaktan uzak kılıyor.
Modern YZ, çıktılar üretmek için derin öğrenme algoritmalarına ve büyük veri yığınlarını analiz etmeye dayanıyor.
Model performansını artırmak, muazzam veri hacimleri gerektiriyor, ancak her veri artışı ile elde edilen doğruluk kazanımları marjinal hale geldi.
Artan hesaplama gücü talebi ve yüksek enerji maliyetleri, YZ modellerini eğitmeyi daha zor, hatta pratik olmayan bir hale getiriyor.
ChatGPT gibi örnekler, eğitim verisi boyutunda muazzam artışlara rağmen sürümler arasındaki ilerlemenin daha az etkili hale geldiğini gösteriyor.
Son araştırmalar, YZ doğruluğunu marjinal olarak artırmanın milyarlarca dolara mal olabileceğini ve önemli çevresel emisyonlarla sonuçlanabileceğini doğruluyor.
Kuantum ya da hibrit YZ gibi verimliliği artırmak için öneriler olsa da, bunlar yakın gelecekte pratik uygulamalardan çok uzak durumda.

Prensipler:

Bu sorunu anlamak için, YZ'nin nasıl çalıştığına dair temel prensipleri kavramamız gerekiyor. Modern YZ, veri içerisindeki eğilimleri ve kalıpları tanımlamak için derin öğrenme algoritmaları ve yapay sinir ağları kullanır. Daha sonra aynı eğilim ve kalıpla uyumlu yeni veriler çıkarabilir veya üretebilir. Bu, geniş miktarda verinin analiz edilmek üzere YZ'ye verildiği "eğitim" ile başlar, bu da bu kalıpları bulmasını sağlar. Daha sonra YZ'den çıktılar istenebilir. Bu temel kavram, bilgisayarla görme, kendi kendine giden arabalar, sohbet robotları ve üretken YZ'nin temelini oluşturur. Bu basitleştirilmiş bir açıklama ama şu an için anlamamız gereken her şey bu. Geçtiğimiz birkaç yıl içinde, YZ önemli ölçüde daha yetenekli hale geldi. Bu, kısmen daha iyi programlama ve algoritma geliştirilmesine, ancak büyük ölçüde daha büyük veri kümeleri üzerinde eğitildiği için oldu. Bu, veri kalıplarını daha doğru anlamasını ve dolayısıyla daha hassas sonuçlar üretmesini sağlar. Ancak bir sorun var; YZ eğitimi, hem veri hem de gerekli hesaplama gücü açılarından önemli ölçüde azalan getiriler gösteriyor.

Veri ile Başlayalım:

Kedileri ve köpekleri tanımak için tasarlanmış basit bir YZ inşa ettiğimizi varsayalım, 100 kedi ve köpek görüntüsü ve videosu kullanılarak eğitilmiş, %60'lık bir tanıma oranı elde edilmiş. Eğitim görüntüleri ve videoları 200'e çıkarmak, tanıma oranını biraz artırır, belki %65 gibi bir şeye. Görüntüleri ve videoları tekrar 400'e çıkarmak, %67.5 civarında marjinal bir iyileşmeye yol açar. Bu kısmen, daha küçük bir veri kümesi ile her yeni eğitim görüntüsünün, daha büyük bir veri kümesine yeni bir görsel eklemeye göre nispeten daha fazla yeni veri sağladığı içindir. Ancak aynı zamanda, YZ'nin küçük bir veri kümesinde hızlıca yeni bağlantılar ve eğilimler oluşturabilmesi nedeniyledir, çünkü sadece birkaç örnekle çalışan bir eğilim bulması gerekir. Ancak bu veri kümesi büyüdükçe, tüm veri kümesi için çalışan yeni yenilikçi eğilimler ve bağlantılar bulmak daha zor hale gelir. Daha büyük veri kümelerinden elde edilen bu yeni eğilimler ve bağlantılar, YZ'nin daha iyi ve daha verimli hale gelmesini sağlar. Böylece, YZ'yi belirli bir miktarda iyileştirmek için gereken eğitim verileri miktarında önemli bir artış görüyoruz çünkü eğitiminde azalan getirilere ulaşıyoruz.

YZ büyük veri merkezleri gerektirir... wikimedia'dan

Hesaplama Sorunu:

YZ'yi eğitmek önemli hesaplama gücü gerektirir. Bu bağlamda, her bir veri noktası, veri kümesindeki her diğer noktayla karşılaştırılmalı ki bu bağlantılar ve eğilimler bulunabilsin. Bu da YZ'nin eğitim veritabanına eklenen her bir veri için, bu veritabanında eğitilmesi için gereken hesaplama iş yükünün önemli ölçüde arttığı anlamına gelir. Bu nedenle, eğer bu ileri düzey YZ'leri sürekli eğitmek için gereken muazzam miktarda veriyi elde etmeyi başarırsanız, bu veri kümelerini kullanmak için gereken hesaplama gücü ve enerji eninde sonunda pratik olmayacak seviyelere ulaşır. Ne yazık ki, kanıtlar, artan eğitim veri kümelerinin azalan getirilerinin ve bu veri kümelerini kullanmak için gerekli hesaplama gücündeki büyük artışların YZ gelişimine katı bir tavan yerleştirdiği bir aşamada olduğumuzu gösteriyor. Örneğin, öncü YZ programı ChatGPT4'ü ele alalım. ChatGPT3'e göre ChatGPT4'ün gelişimi, ChatGPT3'ün ChatGPT2'ye göre gelişiminden küçüktü. Daha doğru olmakla birlikte, hala ChatGPT3 ile aynı halüsinasyon sorunlarına ve kavrayış eksikliklerine sahiptir. ChatGPT3'ün eğitim veritabanı boyutu ChatGPT2'ye göre yaklaşık 78 kat daha büyüktü ve ChatGPT4, ChatGPT3'e göre yaklaşık 571 kat daha büyük bir veritabanı kullanıyor. Eğitim veritabanı boyutundaki bu büyük artışa rağmen, ChatGPT4 hala kullanım alanlarını ciddi şekilde sınırlayan büyük kusurlardan muzdariptir. Örneğin, herhangi bir şekilde gerçek bir bilgi yazabilmesi güvenilir değildir, çünkü hala gerçekleri uydurur. Bazı tahminlere göre, ChatGPT4'ün ham eğitim veritabanı 45 terabayt düz metinden oluşuyor. Bir sonraki sürümün, ChatGPT4'ün ChatGPT3'e göre sağladığı kadar gelişme gösterebilmesi için eğitim veritabanının on binlerce terabayt olması gerekecek. Bu miktarda düz metin veriyi elde etmek ve hazırlamak basitçe pratik değildir. Dahası, bu veri setini kullanarak YZ'yi eğitmek, o kadar fazla enerji tüketecektir ki, maliyeti YZ'yi tamamen olanaksız hale getirecektir, hatta bir kâr amacı gütmeyen kuruluş için bile. Bu bir abartı değil, çünkü tasarım şirketi, gelişmiş YZ'yi pratik hale getirecek bir enerji atılımı gerektiğini kamuya açıkladı. Ne yazık ki, nükleer füzyonu çözsek bile, bu yüzyılda ya da muhtemelen bir sonraki yüzyılda mevcut enerji kaynaklarımızdan daha ucuz olmayacaktır. Aslında, hiçbir enerji türünün şu an sahip olduğumuzdan çok daha ucuz hale gelmesi planlanmıyor. Bu nedenle, YZ enerji sorununa önerilen bu çözüm oldukça yanıltıcıdır.

... ve muazzam hesaplama süreleri pezels'ten

Kanıtlar Neler?

Massachusetts Amherst Üniversitesi'nden bir çalışma, görüntü tanıma için YZ performansını %95'ten fazla doğrulukla artırmanın hesaplama ve enerji maliyetlerini inceledi. Bu tür bir modeli eğitmenin 100 milyar dolara mal olacağı ve New York şehrinin bir ayda ürettiği karbon emisyonlarına eşdeğer emisyonlar üreteceği sonucuna vardı. Düşük hatalı kararlar içeren %5'lik bir hata payı için, YZ'nin doğruluğunu %99'a çıkarmak için çok daha fazla maliyet ve karbon emisyonu gerekeceği sonucu çıkarıldı. Bu nedenle, Tesla'nın mevcut yaklaşımıyla tamamen kendi kendine giden araba geliştirmeyeceği sonucuna varıldı. Tesla'nın kullandığı otomatik pilot sistemi, yalnızca bu tür bir YZ bilgisayar görüşü aracılığıyla dünyayı algılıyor ve tamamen otonom olmak için görüntü tanıma doğruluğunun %100'e yaklaşması gerektiği göz önüne alındığında, bu çalışmaların çok daha fazla maliyet gerektireceği açık. Başka bir deyişle, YZ endüstrisi daha verimli hale gelecek bir yol bulmazsa, bu tavana ulaşamayacak ve YZ geliştirme duracak.

Kaza sonrası kendi kendine giden araba wikimedia'dan

Sonuç:

Analog ve kuantum teknolojilerini birleştiren daha verimli YZ cihazları ve çok daha küçük eğitim veri setleri gerektiren yeni YZ mimarileri gibi potansiyel çözümler ufukta beliriyor (belki deepseek bu çerçevede çalışır). Ancak, bu kavramlar hala başlangıç aşamasında ve gerçek dünya kullanımına jel yıllar uzakta olabilir. Kısacası, YZ'nin önümüzdeki yıllarda beklentilerin çok altında düşmesine hazırlıklı olun.