Yükleniyor...
Hiç bilmeyenler için, yapay zekanın ne olduğunu ve farklı türlerinin nasıl çalıştığını basit ve anlaşılır şekilde öğren.
Yapay zeka (AI), bilgisayarların insan gibi düşünmesini, öğrenmesini ve karar vermesini sağlayan teknolojidir. Tıpkı bir çocuğun binlerce örnek görerek "kedi" ile "köpeği" ayırt etmeyi öğrenmesi gibi, yapay zeka da milyonlarca veriyi inceleyerek kalıpları tanır. Programcılar tek tek kural yazmak yerine, bilgisayara örnekler gösterir ve bilgisayar kendi kurallarını kendisi çıkarır. Mesela bir spam filtresi: binlerce spam e-postayı inceleyerek, yeni bir e-postanın spam olup olmadığını tahmin eder.
ChatGPT gibi sohbet yapay zekaları "Büyük Dil Modeli" (LLM) olarak adlandırılır. Çalışma prensibi aslında çok basit: bir cümledeki bir sonraki kelimeyi tahmin etmek. İnternetteki milyarlarca metin üzerinde eğitilmiş bu modeller, "Bugün hava çok..." yazdığında "güzel" veya "sıcak" gibi en olası devamı tahmin eder. Ama bunu milyarlarca parametre ile yaptığı için, sonuç inanılmaz tutarlı ve akıllıca cevaplar olur. Aslında gerçekten "anlamaz" — ama kalıpları o kadar iyi tanır ki, anlıyormuş gibi görünür.
"Bir kedi astronot olarak uzayda" yazıyorsun, yapay zeka sana o görseli çiziyor. Nasıl mı? "Diffusion" (yayılma) modelleri adı verilen bir yöntemle. Düşün ki bir fotoğrafa adım adım rastgele parazit (gürültü) ekliyorsun, ta ki tamamen bulanık olana kadar. Şimdi yapay zeka tam tersini yapıyor: tamamen gürültülü bir görselken başlıyor ve adım adım gürültüyü temizleyerek anlamlı bir görsel ortaya çıkarıyor. Senin yazdığın metin ise bu temizleme sürecine yön veriyor — "kedi" dersen kedi şekli, "uzay" dersen uzay arka planı oluşuyor.
Video üreten yapay zeka, görsel üretme mantığını bir adım öteye taşır. Tek bir resim yerine saniyede 24-30 kare üretir ve bu kareler arasında tutarlılık sağlar. Yani ilk karede bir kedi varsa, sonraki karede de aynı kedi olmalı — sadece biraz hareket etmiş olarak. Model, hem her kareyi ayrı ayrı üretmeli hem de kareler arası akıcılığı korumalıdır. Bu yüzden video üretmek, görsel üretmekten çok daha fazla hesaplama gücü gerektirir. Sora, Runway gibi araçlar bu teknolojiyi kullanır.
Müzik yapay zekası, ses dalgalarını veya nota dizilerini öğrenerek yeni müzik üretir. "Neşeli bir piyano melodisi" dediğinde, model daha önce öğrendiği binlerce piyano parçasındaki kalıpları kullanarak yeni bir melodi oluşturur. Ses dalgası düzeyinde çalışan modeller ham ses üretirken, nota düzeyinde çalışanlar önce notaları oluşturup sonra sese çevirir. Metin-konuşma (TTS) modelleri de benzer şekilde çalışır: metni analiz edip insan sesine benzer ses dalgaları üretir.
Arka plan kaldırma, fotoğraf kalitesini artırma, nesneleri silme gibi işlemler yapan yapay zeka modelleri, görseldeki pikselleri analiz ederek çalışır. Örneğin arka plan kaldırma modeli, her pikselin "ön plan mı, arka plan mı" olduğunu tahmin eder. Kalite artırma (upscale) modeli ise düşük çözünürlüklü bir görseledeki eksik pikselleri, milyonlarca yüksek çözünürlüklü görsel görmüş deneyimiyle "tahmin ederek" doldurur. Sonuç: 4 kat daha keskin bir görsel.
Belge analizi yapan yapay zeka, uzun metinleri okuyup önemli noktaları çıkarır. OCR (Optik Karakter Tanıma) ise fotoğraftaki veya taranmış belgedeki yazıları tanıyarak dijital metne dönüştürür. Bu modeller, metnin anlamını "vektörler" denilen sayısal temsillerle kavrar. Böylece "araba" ve "otomobil" kelimelerinin aynı anlama geldiğini bilir. PDF'lerdeki tabloları, başlıkları ve paragrafları anlayarak size özet çıkarabilir veya sorularınıza cevap verebilir.