Mimari: transformer'dan modern modellere
Tüm modern LLM'lerin kökenini aldığı transformer mimarisi, iki temel yapıtaşı üzerine kuruludur. Birincisi, modelin metindeki her pozisyon için diğer pozisyonların temsillerinin ağırlıklı bir kombinasyonunu hesaplamasını sağlayan auto-attention mekanizmasıdır. Bu işlem doğası gereği paralel çalışabilir, bu da transformer'ların 2017'ye kadar NLP alanında hakim olan tekrarlayan mimarilerin (RNN, LSTM) yerini almasını sağlamıştır. İkinci yapıtaşı ise, her biri temsili daha da rafine eden onlarca aynı transformer katmanının üst üste dizilmesidir (genellikle öncü modellerde 32 ile 96 arasında).
Günümüz LLM'leri mimari olarak birkaç varyanta ayrılır:
- Dense modeller: Her çıkarımda tüm parametreler aktif olur (ör. GPT-4 tarihi, Claude, Llama 3.1 405B);
- Mixture of Experts (MoE) modelleri: Yalnızca işlenen token'a göre bazı uzman alt-ağlar etkinleşir, bu da eşdeğer parametreyle çıkarım maliyetini düşürür (Mixtral, DeepSeek-V3, olası GPT-4o);
- Doğal multimodal modeller: Metin, görsel, ses ve videoyu birleşik bir temsilde işleyip üretebilir (Gemini, GPT-4o, Pixtral Large, Claude 3.5 Sonnet);
- Reasoning models (akıl yürütme modelleri): Yanıt vermeden önce açık bir düşünce zinciri üretirler - DeepSeek-R1, OpenAI o1/o3, Tencent Hunyuan-T1, Gemini Thinking - bu da matematik, mantık ve programlama görevlerinde daha yüksek kalite sağlar ancak gecikmeyi artırır.
2026'daki başlıca aktörler
OpenAI, ChatGPT, GPT-4o, GPT-4o mini ve o1/o3 reasoning modelleri ailesiyle pazarda algılanan liderliğini sürdürüyor. 2026'da birkaç yüz milyar dolar değerlemeye ulaşan şirket, esas olarak Microsoft ve SoftBank tarafından finanse ediliyor. Ticari stratejisi API (token başına ödeme), son kullanıcı ürünü (ChatGPT Plus aylık 20 $) ve kurumsal (ChatGPT Enterprise, Azure OpenAI Service) seçeneklerini birleştiriyor. OpenAI, OAI-SearchBot arama tarayıcısı ve SearchGPT ile faaliyet alanını genişletti.
Anthropic, 2021'de OpenAI'dan ayrılan Dario ve Daniela Amodei'nin de aralarında olduğu bir ekip tarafından kuruldu ve güvenliği temel farklılaştırıcı olarak konumlandırdı. Claude ailesi (Haiku, Sonnet, Opus), özellikle yazı, kod ve uzun bağlamda akıl yürütmede öne çıkıyor. Anthropic, Amazon, Google ve SoftBank tarafından finanse ediliyor. Mayıs 2026'da Anthropic, xAI'nin Colossus 1 kapasitesinin bir bölümünü aylık yaklaşık 1,25 milyar dolara kiraladığını doğruladı; bu da hesaplama kaynaklarının yoğunlaşmasını gözler önüne seriyor.
Google DeepMind, 2023'ten itibaren AI faaliyetlerini Gemini markası altında topladı. Gemini ailesi (Nano, Flash, Pro, Ultra ve Aralık 2024'te Gemini 2.0 Flash), arama motoruna (AI Overviews) ve Workspace paketine entegre edildi. Google, eğitim verilerini (Web, YouTube, Books) ve TPU altyapısını kontrol etmesiyle yapısal bir avantaja sahip.
Meta, weights open stratejisiyle Llama ailesini (Llama 1 Şubat 2023, Llama 2 Temmuz 2023, Llama 3 Nisan 2024, Llama 3.1 405B Temmuz 2024) piyasaya sürdü. Bu strateji, foundation models'a erişimi demokratikleştirdi ve türev modeller (Vicuna, Tulu, sektörel fine-tuning'ler) için bir ekosistem oluşturdu. Ancak Meta, Temmuz 2025'te Avrupa GPAI uygulama kodunu imzalamayı reddetti ve Llama 3 multimodal'in Avrupa çıkışını geçici olarak askıya aldı.
Mistral AI, Nisan 2023'te Paris'te Arthur Mensch, Guillaume Lample ve Timothée Lacroix tarafından kuruldu ve Avrupa'nın şampiyonu olarak öne çıktı. Hibrit stratejisi, açık modelleri (Mistral 7B, Mixtral 8x7B, Codestral Mamba, Mathstral, Ministral 3B/8B) ve tescilli modelleri (Mistral Large 2, Pixtral Large) birleştiriyor. Mistral, GPAI uygulama kodunu imzaladı ve NVIDIA (Mistral NeMo 12B), Dassault Systèmes, Capgemini ve SAP ile stratejik ortaklıklar kurdu.
Çin'de Alibaba (Qwen ailesi), Baidu (ERNIE 4.5, ERNIE X1), Tencent (Hunyuan-T1) ve özellikle DeepSeek, ABD laboratuvarlarını yakaladı ve ardından meydan okudu. DeepSeek-V3, Ocak 2025'te, rakiplerine göre yaklaşık 30 kat daha düşük eğitim maliyetiyle ulaştığı kaliteyle topluluğu şaşırttı. Hemen ardından çıkan ve Haziran 2025'te (R1-0528) güncellenen DeepSeek-R1, NVIDIA'nın aşırı altyapı avantajını sorgulatarak geçici bir borsa düşüşüne neden oldu.
Diğer aktörler ise uzmanlaşmış roller üstleniyor: xAI (Grok, Colossus altyapısı), Cohere (çok dilli kurumsal modeller, Aya 23), AI2 (Tülu 3 405B, tamamen açık modeller), Aleph Alpha (Pharia-1-LLM Almanca), Black Forest Labs (FLUX-1 text-to-image için), LightOn (Paradigm kurumsal için), Hugging Face (model hub'ı, SmolLM2), OpenEuroLLM (Avrupa açık konsorsiyumu).
2026'nın referans modelleri
2026'da öncü LLM tablosu, her biri farklı boyut ve varyantlara sahip yaklaşık bir düzine aileden oluşuyor:
- GPT-4o / GPT-4o mini (OpenAI) - doğal multimodal, düşük gecikme, 128k token bağlam penceresi. GPT-4o mini, yüksek hacimli dağıtımlar için ekonomik referans haline geldi.
- o1 / o3 (OpenAI) - dahili chain-of-thought reasoning modelleri, rekabetçi matematikte (AIME, IMO) ve programlamada (Codeforces) çok güçlü.
- Claude 3.5 Sonnet / Claude 3 Opus (Anthropic) - 200k pencere, uzun metin yazımı ve belge okuma konusunda mükemmel.
- Gemini 2.0 Flash / Gemini Ultra (Google DeepMind) - doğal multimodal, Google ekosistemiyle entegre.
- Llama 3.1 405B / Llama 3.3 (Meta) - open source dense lideri.
- Mistral Large 2 / Pixtral Large (Mistral AI) - Avrupalı, bazı sürümleri open weights.
- DeepSeek-V3 / DeepSeek-R1-0528 (DeepSeek) - Çin open source, reasoning, çok düşük eğitim maliyeti.
- Qwen2.5 (Alibaba) - Çin çok dilli open source lideri, 1M token pencere.
- NOVA (Amazon) - Aralık 2024'te duyurulan kendi foundation ailesi.
- Phi-3 / Phi-3.5 (Microsoft) - gömülü kullanım için küçük ve verimli modeller.
- Hunyuan-T1 (Tencent) - Çin reasoning modeli, state-of-the-art ile rekabetçi.
- Grok 3 (xAI) - X'e gerçek zamanlı erişim, dev altyapı.
Eğitim ve maliyetler
Bir öncü LLM'in eğitimi, büyük kaynaklar gerektiriyor. GPT-4 için kamuya açık tahminler, yaklaşık 100 milyon dolar bütçe ve üç ay boyunca on binlerce GPU H100 kullanıldığını öne sürüyor. Llama 3.1 405B ise 16.000 H100 ve yaklaşık 30 milyon GPU saati gerektirdi. Mistral Large 2 ve Mixtral gibi Avrupa'nın diğer ucundaki modeller ise çok daha mütevazı bütçelerle eğitildi; bu da veriler üzerinde özenli çalışma ile rekabetçi performansa düşük maliyetle ulaşılabileceğini gösteriyor.
OpenAI tarafından ortaya konan ve DeepMind tarafından (Chinchilla, 2022) geliştirilen scaling laws uzun süre dinamiği belirledi: Bir modelin kalitesi, parametre sayısı ile eğitim verisi miktarının çarpımıyla öngörülebilir şekilde artar; ancak ikisi dengelenmelidir. 2024 sonunda bu denklem sorgulanmaya başlandı: Bütçelerin şişmesi artık açık benchmark'larda büyük kazanımlar getirmiyor ve odak başka boyutlara kaydı - veri kalitesi, eğitim sonrası reasoning, ajanlar, multimodalite.
Hesaplama altyapısı artık başlıca jeopolitik meselelerden biri haline geldi. NVIDIA, H100/H200/B200 GPU'lar üzerindeki neredeyse tekel konumuyla değerin büyük kısmını topluyor. ABD'nin ihracat kontrolleri Çin'e satışları kısıtladı ve bu, DeepSeek ile Alibaba'yı eğitimlerini düşük kapasiteli çiplere (H800) optimize etmeye itti. xAI, 2024'te Memphis'te Colossus veri merkezini inşa etti; 100.000 H100 ardından 200.000 H100/H200'ü bir yıldan kısa sürede entegre ederek endüstriyel bir rekora imza attı.
Kapasiteler ve sınırlamalar
Modern LLM'ler, yazma, özetleme, çeviri, kod üretimi, diyaloğa girme, bilgi çıkarımı, sınıflandırma, yapılandırılmış ve yapılandırılmamış belge işleme gibi çok geniş bir görev yelpazesini başarıyla yerine getiriyor. Pek çok uygulamada standart bileşen haline geldiler - sohbet tabanlı arama motorları, kod asistanları (Copilot, Cursor), hukuk ve tıp ajanları, müşteri destek sistemleri, Office ve Workspace üretkenlik araçları.
Sınırlamaları da iyi belgelenmiş durumda. LLM'ler halüsinasyon görür - özellikle niş konular, hassas sayılar ve bibliyografik referanslarda - gerçekçi ama yanlış içerik üretebilirler. Adversarial saldırılara (prompt injection, jailbreak) karşı dayanıklı değiller; bu, Aralık 2024'te EPFL tarafından yapılan ve LLM'lerin uyarlanabilir saldırılara karşı sınırlarını gösteren çalışmada ortaya kondu. Kullanıcıların görüşlerini değiştirmek için manipüle edilebilirler (Nisan 2024 EPFL çalışması). Enerji ve su tüketimleri kayda değerdir; bu konu giderek daha fazla düzenleyici ve hissedarlar tarafından izleniyor. Önyargıları ise, ağırlıklı olarak İngilizce ve Batı Avrupa/Kuzey Amerika odaklı eğitim verilerinden kaynaklanıyor.
Open source vs tescilli
2023'ten bu yana açık ve kapalı LLM'ler arasındaki ayrım tartışmanın temelini oluşturuyor. Açık model savunucuları - Meta, Mistral, Hugging Face, AI2, DeepSeek, La Quadrature du Net - teknolojik egemenlik, bağımsız denetim, akademik yayılım ve endüstriyel dayanıklılık argümanlarını öne sürüyor. Karşıtları - Anthropic, OpenAI (bazı alanlarda) - ise kötüye kullanım riskleri (biyoterörizm, büyük ölçekli dezenformasyon, dolandırıcılık) ve bir model yayınlandıktan sonra geri çekilememesi sorununa dikkat çekiyor.
AI Act, parametreleri, mimarisi ve kullanım bilgileri yayınlanan modellere kısmi muafiyetler tanıyarak bu tartışmayı kısmen çözüyor. Ancak bu muafiyetler sistemik riskli modellere (10²⁵ FLOPS eğitim) uygulanmıyor. 2026'da open source ekosistemine Llama, Mistral, DeepSeek ve Qwen hakim; bu modeller, tek bir sağlayıcıya API bağımlılığı olmadan kurumsal ve akademik kullanımın çoğunu karşılıyor.
Uzmanlaşmış ve dikey modeller
Genel amaçlı modellerin ötesinde, ekosistem dikey modellere doğru çeşitleniyor. Tıpta: Bioptimus'un H-optimus-0 modeli ile destekli tıbbi teşhis, Aleph Alpha'nın Almanca Pharia-1-LLM'i, radyoloji ve onkolojiye özel fine-tuning'ler. Hukukta: Lefebvre Dalloz-Barreau de Paris asistanları, Talan-Mutuelle Générale uygulamaları. Kodda: Codestral (Mistral), Code Llama (Meta), DeepSeek-Coder. Finans alanında: BNP Paribas, Crédit Agricole, JPMorgan'ın dahili modelleri. Küçük ve verimli modeller (SLM, Small Language Models) hareketi - Phi-3, Mistral Ministral, SmolLM2, Gemma 2 2B - gömülü dağıtımlar (telefon, araç, IoT) için düşük çıkarım maliyetinde kabul edilebilir kalite hedefliyor.
2025 yılı, LLM'lerin yeni kullanım paradigması olarak AI ajanlarının yükselişine sahne oldu. Artık ajanlar, tek bir isteğe yanıt vermek yerine, karmaşık bir görevi çözmek için bir dizi eylemi (araç çağrıları, web danışmaları, dosya yazımı, kod yürütme) zincirleme şekilde gerçekleştiriyor. Gemini 2.0 Flash, Aralık 2024'te bu yeni ürün ailesinin öncüsü olarak tanıtıldı. AI Builders'ın AI Decision Matrix ürünü, IT yöneticileri için çözüm bolluğunda karşılaştırmalı değerlendirme çerçevesi sunuyor.
2026 ve sonrası için gündem
Önümüzdeki 18 ayda izlenmesi gereken başlıca dinamikler:
- GPAI uyumu ve AI Act'in, Ağustos 2025'ten itibaren yürürlüğe girmesi;
- Çıkarım ekonomisi, eğitim ekonomisinin önüne geçerek hacim açısından baskın hale geldi; MoE mimarileri ve quantization (BitNet, vLLM, llm-optimizer) öne çıkıyor;
- Telif hakkı ile ilişki, özellikle Fransa'da Darcos yasasının rafa kaldırılması ve Meta-Llama, NYT-OpenAI, Getty-Stable Diffusion üzerindeki güncel yargı süreçleri sonrasında;
- Reasoning modelleri yarışı, OpenAI o3, DeepSeek-R1, Gemini Thinking ve Hunyuan-T1 arasında rekabetle;
- Multimodal yakınsama, metin, görsel, video ve sesi birleşik bir temsilde işleyebilen doğal modellerle;
- Ajanların yükselişi ve bununla bağlantılı olarak güvenilirlik (uzun görevlerde başarı oranı), güvenlik (yapılan eylemlerin kontrolü) ve iş modeli soruları;
- Avrupa egemenliği, Mistral, OpenEuroLLM, LightOn, Aleph Alpha ve OVHcloud ile yeni NVIDIA Tensor Core GPU'larla çıkarım hesaplamasının bağımsızlaştırılması çabasında somutlaşıyor.
LLM'lerin evrimi artık yalnızca parametre yarışına indirgenemez. Kazanan aktörler, veri kalitesi, pekiştirmeli eğitim sonrası süreçler, hakim çıkarım altyapısı, hedef pazara uygun lisans stratejisi ve düzenleyici uyumluluğu bir araya getirecek. Konu artık bilimsel olduğu kadar endüstriyel, jeopolitik ve hukuki bir mesele.