OpenAI, perşembe günü yaptığı duyuruyla yeni nesil büyük dil modeli (LLM) ailesi GPT-5.2’yi teknoloji dünyasının gündemine taşıdı. Bu gelişme, yapay zeka öncüsü şirketin, rakibi Google’ın Gemini 3 LLM’sinin geçen ay önemli üçüncü taraf performans sıralamalarında ve kıyaslamalarında zirveyi ele geçirmesinin ardından artan bir baskı altında olduğu kritik bir dönemde geldi. Ancak OpenAI liderleri, bu sürümün zamanlamasının Gemini 3’ten çok önce planlandığını vurguladı.
- GPT-5.2: Profesyonel Bilgi İşlemde Yeni Bir Dönem
- Geniş Bağlam Penceresi ve Güncel Bilgi
- ‘Kod Kırmızı’ Gerçeği ve Zamanlama Tartışması
- Modelin Altındaki Teknolojiler: Hızlı, Düşünen ve Profesyonel
- Performans Metrikleri: Kıyaslamaları Geride Bırakmak
- Diğer Önemli Kıyaslama Sonuçları:
- Zekanın Maliyeti: API Fiyatlandırması
- Görüntü Üretimi: Henüz Yeni Bir Şey Yok, Ama “Daha Fazlası Gelecek”
- ‘Süper Ajan’ Dönemi ve Uzun Süreli Görevler
- Bilim ve Güvenilirlik Vurgusu
- “Vibe” Değişikliği ve Eski Modeller
- Güvenlik, ‘Yetişkin Modu’ ve Gelecek Yol Haritası
GPT-5.2: Profesyonel Bilgi İşlemde Yeni Bir Dönem
OpenAI, GPT-5.2’yi “profesyonel bilgi işlemleri için en yetenekli model serisi” olarak tanımlıyor ve akıl yürütme, kodlama ve ajan iş akışlarında sunduğu önemli iyileştirmelerle performans tacını geri almayı hedefliyor.
OpenAI Uygulamalar CEO’su Fidji Simo, basın brifinginde yaptığı açıklamada, “Bu, en gelişmiş sınır modelimiz ve piyasadaki profesyonel kullanımlar için en güçlüsü,” dedi. Simo, “5.2’yi insanların daha fazla ekonomik değer yaratmasını sağlamak için tasarladık. E-tablolar oluşturma, sunumlar hazırlama, kod yazma, görüntüleri algılama, uzun bağlamları anlama, araçları kullanma ve karmaşık, çok adımlı projeleri ele alma konularında daha iyi,” diye ekledi.
Geniş Bağlam Penceresi ve Güncel Bilgi
GPT-5.2, yüzlerce belgeyi veya büyük kod depolarını tek seferde işleyebilen devasa 400.000 token’lık bir bağlam penceresine sahip. Ayrıca, 128.000 token’lık maksimum çıktı limiti, tek seferde kapsamlı raporlar veya tam uygulamalar üretilmesine olanak tanıyor.
Modelin bilgi kesme tarihi 31 Ağustos 2025 olarak belirlendi, bu da nispeten güncel dünya olayları ve teknik belgelerle uyumlu olmasını sağlıyor. Mimarisinin popülerleştirilen “zincir-düşünce” işlemesini kullandığını doğrulayan “Akıl Yürütme token desteği” de açıkça belirtildi.
‘Kod Kırmızı’ Gerçeği ve Zamanlama Tartışması
Bu sürüm, The Information’ın OpenAI CEO’su Sam Altman’dan gelen ve Gemini 3’ün ortaya çıkardığı “kalite açığını” gidermeye yönelik ChatGPT’yi iyileştirme yönündeki acil “Kod Kırmızı” direktifine ilişkin raporunun ardından geldi. The Verge da GPT-5.2’nin zamanlaması hakkında benzer haberler yapmıştı.
Brifing sırasında OpenAI yöneticileri, bu direktifi kabul etmekle birlikte, modelin yalnızca Google’a yanıt olarak aceleye getirildiği anlatısını reddetti. Simo, “Bunun birçok, birçok aydır üzerinde çalıştığımızı belirtmek önemli,” dedi. “Bu Kod Kırmızı’yı şirkete tek bir alanda kaynakları seferber etmek istediğimizi belirtmek için duyurduk… ancak bu, özellikle bu hafta çıkmasının nedeni değil.”
OpenAI’nin eğitim sonrası ekibinin lideri Max Schwarzer, panik lansmanı fikrini dağıtmak için bu görüşü destekledi: “Bu sürümü çok uzun zamandır planlıyorduk… bu özel hafta birçok ay önce konuştuğumuz bir haftaydı.”
Bir OpenAI sözcüsü, “Kod Kırmızı” çağrısının yalnızca temel model geliştirmesini veya yeni modellerin yayınlanmasını değil, ChatGPT ürünü için geçerli olduğunu açıkladı.
Modelin Altındaki Teknolojiler: Hızlı, Düşünen ve Profesyonel
OpenAI, GPT-5.2 sürümünü ChatGPT içinde üç farklı katmana ayırıyor. Bu strateji, “akıl yürütme” modellerinin devasa hesaplama maliyetlerini kullanıcıların hız talebiyle dengelemeyi amaçlıyor:
- GPT-5.2 Instant: Yazma, çeviri ve bilgi arama gibi günlük görevler için hıza odaklanmıştır.
- GPT-5.2 Thinking: “Karmaşık, yapılandırılmış işler” ve uzun süren ajanlar için tasarlanmıştır. Kodlama, matematik ve çok adımlı projeleri yönetmek için daha derin akıl yürütme zincirlerinden yararlanır.
- GPT-5.2 Pro: Yeni ağır siklet şampiyonu. OpenAI bunu “en akıllı ve en güvenilir seçeneği” olarak tanımlıyor ve kalite gecikmeden daha önemli olduğunda zorlu sorular için en yüksek doğruluğu sunuyor.
Geliştiriciler için modeller, API’de hemen gpt-5.2, gpt-5.2-chat-latest (Instant) ve gpt-5.2-pro olarak mevcuttur.
Performans Metrikleri: Kıyaslamaları Geride Bırakmak
GPT-5.2 sürümü, özellikle rakiplerin son zamanlarda zemin kazandığı “profesyonel bilgi işlem” boşluğunu hedefleyen çoğu alanda lider metrikler içeriyor.
OpenAI, 44 meslek grubunda “iyi tanımlanmış bilgi işlem görevleri” performansını ölçen GDPval adlı yeni bir kıyaslama vurguladı. Simo, “GPT-5.2 Thinking artık bu kıyaslamada en güncel duruma sahip… ve uzman insan yargıçlarına göre e-tablolar, sunumlar ve belge oluşturma gibi iyi tanımlanmış profesyonel görevlerin %70,9’unda sektör profesyonellerini geride bırakıyor veya onlarla eşit seviyede,” dedi.
Kritik kodlama alanında OpenAI iddialı bir liderlik iddiasında bulunuyor. Schwarzer, gerçek dünya yazılım mühendisliği değerlendirmesi olan SWE-bench Pro’da GPT-5.2 Thinking’in %55,6 ile yeni bir en güncel skoru elde ettiğini belirtti. Bu kıyaslamanın “önceki kıyaslamalara göre daha kirlenmeye dirençli, zorlayıcı, çeşitli ve endüstriyel olarak ilgili” olduğunu vurguladı.
Diğer Önemli Kıyaslama Sonuçları:
- GPQA Diamond (Bilim): GPT-5.2 Pro, %93,2 ile GPT-5.2 Thinking’i (%92,4) ve GPT-5.1 Thinking’i (%88,1) geride bıraktı.
- FrontierMath: GPT-5.2 Thinking, Seviye 1-3 problemlerinde %40,3’lük bir başarı oranıyla önceki modelin %31,0’lık oranına göre önemli bir sıçrama yaptı.
- ARC-AGI-1: GPT-5.2 Pro, bu genel akıl yürütme kıyaslamasında %90 eşiğini geçen ilk model olarak %90,5 skor elde etti.
Zekanın Maliyeti: API Fiyatlandırması
Performans, bir bedel karşılığında geliyor. ChatGPT abonelik fiyatlandırması şimdilik değişmese de, yeni amiral gemisi modellerinin API maliyetleri, “düşünme” modunun yüksek hesaplama taleplerini yansıtarak önceki nesillere göre oldukça yüksek.
GPT-5.2 Thinking: Giriş token’ları için milyon başına 1,75 ABD doları ve çıkış token’ları için milyon başına 14 ABD doları olarak fiyatlandırıldı.
GPT-5.2 Pro: Maliyetler önemli ölçüde artarak giriş token’ları için milyon başına 21 ABD doları ve çıkış token’ları için milyon başına 168 ABD doları oldu.
GPT-5.2 Thinking, standart GPT-5.1’den (%1,25/%10) %40 daha yüksek bir API fiyatına sahip. GPT-5.2 Pro da önceki GPT-5 Pro’dan (%15/%120) %40 daha pahalı. Bu maliyetlere rağmen, hala OpenAI’nin en pahalı teklifi olan o1-pro modelinden daha uygun.
OpenAI, daha yüksek token başına maliyete rağmen, modelin “daha yüksek token verimliliği” ve görevleri daha az adımda çözebilme yeteneğinin, yüksek değerli kurumsal iş akışları için ekonomik olarak uygulanabilir olduğunu savunuyor.
Görüntü Üretimi: Henüz Yeni Bir Şey Yok, Ama “Daha Fazlası Gelecek”
Brifing sırasında VentureBeat, OpenAI katılımcılarına yeni sürümün görüntü üretimi yeteneklerinde herhangi bir iyileştirme olup olmadığını sordu. Ancak OpenAI yöneticileri, GPT-5.2’nin mevcut görüntü üretimi yeteneklerinde GPT-5.1 veya DALL-E 3 ve gpt-4o modellerine göre herhangi bir iyileştirme sunmadığını belirtti.
Simo, “Görüntü üretimi konusunda bugün duyuracak bir şeyimiz yok, ancak daha fazlası gelecek,” dedi. “Bunun insanlar tarafından sevilen, pazara sunduğumuz çok önemli bir kullanım durumu olduğunu biliyoruz, bu yüzden kesinlikle orada daha fazlası olacak.”
‘Süper Ajan’ Dönemi ve Uzun Süreli Görevler
Ham skorların ötesinde, OpenAI GPT-5.2’yi, insan müdahalesi olmadan çok adımlı iş akışlarını yürütebilen yeni nesil “uzun süreli ajanlar” için bir motor olarak konumlandırıyor.
Simo, “Box’ın verilerine göre 5.2, uzun, karmaşık belgelerden bilgileri yaklaşık %40 daha hızlı çıkarabiliyor ve Yaşam Bilimleri ve sağlık alanında akıl yürütme doğruluğunda %40’lık bir artış görüldü,” dedi. Notion’ın da modeli “her boyutta 5.1’in üzerinde performans gösterdiğini” ve “gerçek bilgi işlemini tanımlayan belirsiz, uzun süren görevlerde mükemmel” olduğunu belirtti.
Schwarzer, Augment Code gibi kodlama girişimlerinin modeli “önceki modellerden önemli ölçüde daha güçlü derin kod yetenekleri sağladığı” için yeni kod inceleme ajanlarını desteklemek üzere seçildiğini ekledi.
Görsel yetenekler de iyileştirilmiş durumda. OpenAI’nin sürüm blog yazısı, “bir gezginin gecikmiş bir uçuşu, kaçırılan bir bağlantıyı, New York’ta bir gece konaklamayı ve tıbbi bir oturma gereksinimini bildirdiği” bir örnek gösteriyor. Sonuç: “GPT-5.2 tüm görev zincirini yöneterek yeniden rezervasyon, özel yardım koltuğu ve tazminat sağlayarak GPT-5.1’den daha eksiksiz bir sonuç elde etti.”
Bir modelin GUI ekran görüntülerini anlama yeteneğini test eden ScreenSpot-Pro adlı yeni bir değerlendirme, GPT-5.2 Thinking’in %86,3 doğruluk oranına ulaştığını, GPT-5.1’in ise sadece %64,2’de kaldığını gösteriyor.
Bilim ve Güvenilirlik Vurgusu
OpenAI liderleri, sohbet robotlarının ötesine geçerek araştırma asistanlarına odaklanma çabasıyla, modelin bilimsel araştırmalar için faydasını da vurguladı. Eğitim ekibi lideri Aidan Clark, bir immünoloji araştırmacısının modeli test ettiği bir örneği paylaştı.
Clark, “Araştırmacı, modeli bağışıklık sistemi hakkındaki en önemli yanıtsız soruları üretmesini isteyerek test etti. Bu immünoloji araştırmacısı, GPT-5.2’nin önceki herhangi bir pro modeline kıyasla daha keskin sorular ve bu soruların neden önemli olduğuna dair daha güçlü açıklamalar ürettiğini bildirdi,” dedi.
Güvenilirlik de önemli bir odak noktasıydı. Schwarzer, yeni modelin “GPT-5.1’den önemli ölçüde daha az halüsinasyon gördüğünü” ve tanımlanmış sorgular setinde “hatalı yanıtların %38 daha az sıklıkta olduğunu” belirtti.
“Vibe” Değişikliği ve Eski Modeller
İlginç bir şekilde, OpenAI her kullanıcının yeni modelleri hemen tercih etmeyebileceğini kabul etti. Eski modellerin neden hala mevcut olacağı sorulduğunda Schwarzer, “modeller her seferinde biraz değişiyor,” diye itiraf etti.
Schwarzer, “Bazı kullanıcılar önceki modelin ‘vibe’ını tercih edebilir, ancak biz en sonuncusunun genel olarak çok daha iyi olduğuna inanıyoruz,” dedi. Ayrıca, “belirli bir model için gerçekten ince ayar yapılmış bir komutları olan” bazı kurumsal müşteriler için “küçük gerilemeler” olabileceğini ve bu nedenle eski sürümlere erişimin gerekli olabileceğini belirtti.
Güvenlik, ‘Yetişkin Modu’ ve Gelecek Yol Haritası
Güvenlik endişelerine değinen Simo, şirketin yeni bir yaş tahmin sisteminin uygulanmasının ardından gelecek yılın ilk çeyreğinde bir “Yetişkin Modu” sunmaya hazırlandığını doğruladı.
Simo, “Yaş tahmin teknolojisini iyileştirme sürecindeyiz,” dedi. “Yetişkin modunu başlatmadan önce bunu yapmak istiyoruz.”
Daha ileriye bakıldığında, sektör raporları OpenAI’nin “Project Garlic” kod adı altında, 2026’nın başlarında amiral gemisi bir sürümü hedefleyen daha temel bir mimari üzerinde çalıştığını gösteriyor. Yöneticiler brifing sırasında belirli gelecek yol haritaları hakkında yorum yapmasa da, Simo mevcut gidişatlarının ekonomisi konusunda iyimserliğini korudu.
Simo, “Tarihsel eğilimlere bakarsanız, hesaplama gücü son üç yılda her yıl yaklaşık 3 kat arttı,” diye açıkladı. “Gelir de aynı hızda arttı… bu da bir kısır döngü yaratıyor.”
Clark, verimliliğin hızla arttığını ekledi: “Bugün piyasaya sürdüğümüz model, bir yıl önceki modellere kıyasla neredeyse 400 kat daha az maliyet ve hesaplama ile [ARC-AGI’de] daha da iyi bir skor elde ediyor.”
GPT-5.2 Instant, Thinking ve Pro, Plus, Pro, Team ve Enterprise aboneleri için ChatGPT’de kullanıma sunulmaya başlandı. Şirket, kararlılığı sürdürmek için dağıtımın kademeli olacağını belirtiyor.
