Şimdi Grok-3 ile sohbet et.
Grok 3: xAI tarafından Gelişmiş Çok Modlu LLM
Grok 3, Elon Musk tarafından kurulan yapay zeka girişimi xAI tarafından geliştirilen Grok ailesine ait çok modlu büyük bir dil modelidir. Grok chatbot'unu güçlendirmek ve gelişmiş akıl yürütme, gerçek zamanlı arama yetenekleri ve çok modlu anlama üzerine odaklanarak karmaşık sorunları çözme ve güncel bilgileri alma konularına vurgu yaparak tasarlanmış Grok 2'nin halefidir.
Grok 3'ün Temel Amacı ve Yetenekleri
Grok 3, mantık, çok adımlı problem çözme ve gerçek zamanlı bilgi alma gerektiren görevlerde birçok mevcut konuşma yapay zekasını geride bırakmayı hedefleyerek, akıl yürütme yeteneğini kapsamlı ön eğitimle harmanlar. Akıl yürütme ve arama entegrasyonu açısından diğer üst düzey sohbet modellerine doğrudan bir rakip olarak sunulmaktadır.
Aşağıda detaylı olarak açıklanan temel özellikleri yer almaktadır:
- Düşün ve DeepSearch modları: Grok 3 iki ana modda çalışabilir. Düşünme modu yapılandırılmış, çok adımlı akıl yürütme ve açıklamalara odaklanırken, DeepSearch modu güncel bilgiler için daha derin, daha çeşitli kaynakları toplamak amacıyla internet tabanlı almayı genişletir. Bu çift modlu yaklaşım, hem titiz problem çözme hem de geniş araştırma görevleri için faydalıdır.
- Devasa bağlam penceresi: Raporlar, bazı yapılandırmalarda 1 milyon tokene kadar bağlam kapasitesine işaret etmektedir, bu da modelin önceki içerik takibini kaybetmeden çok uzun belgeleri, büyük veri kümelerini ve genişletilmiş komutları işlemesine olanak tanır.
- Gelişmiş akıl yürütme ve problem çözme: Grok 3'ün, çözüm taslağı sırasında genellikle pekiştirmeye benzer iyileştirmelerle, çok adımlı akıl yürütme görevlerinde, kanıtlarda ve karmaşık bilimsel veya matematiksel problemlerde üstün olduğu belirtilmektedir.
- Çok modlu anlama: Modelin, metin ve görüntüleri (ve bazen diğer modları) uyumlu bir şekilde işlediği söylenmektedir, bu da diyagramları, grafikleri veya metin girdisiyle birlikte yerleştirilmiş görselleri analiz etmek gibi görevlere olanak tanır.
Grok 3'ün Eğitimi ve Altyapısı
xAI, Grok 3'ün eğitim ölçeğini, yeteneklerini sağlamak için büyük, özel bir süper bilgisayar kümesinin (Colossus) ve önemli GPU gücünün kullanımını vurgulamıştır. Modelin, öncülüne göre daha sağlam hesaplama kaynaklarına sahip olduğu belirtilmektedir.
Grok 3'ün Performansı
Grok 3, öncüllerine ve birçok rakip yapay zeka modeline göre önemli iyileştirmelerle endüstri lideri performans göstermektedir. Temel performans vurguları şunlardır:
- Doğruluk: Grok 3, MMLU'da (Kitle Kaynaklı Çok Görevli Dil Anlama) %92,7, GSM8K'de (Matematiksel Akıl Yürütme) %89,3 ve HumanEval'da (kodlama görevleri) %86,5 doğruluk elde ederek güçlü akıl yürütme, dil ve kodlama yeteneklerini sergilemektedir.
- Hız: Önceki sürümlere göre %30 daha hızlı veri işler ve ChatGPT o1 pro gibi rakip modellere göre %25 daha hızlı yanıt süreleri sunar.
- Verimlilik: Grok 3, enerji tüketimini %30 azaltarak performansı korurken daha verimli hale getirir.
- Ölçek ve kapasite: 2,7 trilyon parametre, 12,8 trilyon tokenlik bir eğitim veri kümesi ve 128.000 tokenlik devasa bir bağlam penceresi ile Grok 3, geniş ve karmaşık komutları işlemede üstündür.
- Karşılaştırmalı Üstünlük: Bağımsız raporlar, Grok 3'ün Grok 2'den yaklaşık 10 kat daha güçlü, %20 daha yüksek doğruluğa sahip ve akıl yürütme ve olgusal doğruluk görevlerinde üstün performans gösterdiğini doğrulamaktadır.
Grok 3 ve Diğer Modellerin Karşılaştırması
| Yön | Grok 3 | GPT-5 | Claude Sonnet 4 |
| Çıkış Tarihi | Şubat 2025 (Beta) | 7 Ağustos 2025 | 22 Mayıs 2025 (Claude 4 ailesi; Sonnet 4.5 29 Eylül 2025'te yayınlandı) |
| Parametreler | Açıklanmadı (200 binden fazla H100 GPU üzerinde eğitildi; Grok 2'ye göre ~10 kat hesaplama gücü) | Açıklanmadı (hibrit çoklu model; GPT-4'ün ~1.76T tahmini'den fazla) | Açıklanmadı (~400B Claude 4 serisi için tahmin; MoE benzeri verimlilik) |
| Bağlam Penceresi | 1 milyon token | 400 bin token (128 bin çıktı) | 200 bin token (Sonnet 4 için 1 milyon beta; 4.5'te genişletildi) |
| MMLU-Pro (Genel Bilgi) | ~%80 (dünya bilgisi konusunda güçlü) | ~%90 (yayınlandığında son teknoloji) | ~%85 (4.5'te geliştirildi) |
| GPQA (Lisansüstü Düzey Bilim) | %75,4 (%84,6 Düşünme modu ile) | %86,0 (%89,4 araçlar/Pro varyantı ile) | ~%83 (%83,4 4.5'te düşünme ile) |
| AIME (Matematik Yarışması) | %52,2 (%93,3 Düşünme modu ile; beta değerlendirmelerinde %100'e kadar) | %94,6 (düşünme/Python ile %100) | ~%78 (4.5'te Python ile %100) |
| HumanEval/LiveCodeBench/SWE-bench (Kodlama) | %57,0 LCB (%79,4 Düşünme modu ile); ~%70 SWE-bench tahmini | %74,9 SWE-bench Doğrulandı; %88 Aider Polyglot | %72,7 SWE-bench (%77,2 4.5'te; %82 paralel hesaplama ile) |
| MMMU (Çok Modlu Anlama) | ~%73 | %84,2 (eğitimden gelen yerel çok modlu) | ~%70 (4.5'te aracılık görevleri için güçlü) |
| Hız (Token/Saniye) | ~63 çıktı | ~128 (üretim için optimize edildi) | ~100 (Claude 3.7'nin iki katı; 4.5'te 30+ saat otonom) |
| Erişim ve Fiyatlandırma | grok.com/X uygulamalarında sınırlamalarla Ücretsiz; daha yüksek kotalar için SuperGrok/Premium+ (ayrıntılar x.ai/grok adresinde); xAI aracılığıyla API | ChatGPT Pro (20 $/ay+); API: giriş için 1,25 $/M, çıkış için 10 $/M (mini/nano için daha ucuz katmanlar) | Claude Pro (20 $/ay); API: giriş için 3 $/M, çıkış için 15 $/M (genişletilmiş bağlam premium) |
HIX AI'da Grok 3'ü Deneyin
Grok 3'e kısıtlama olmadan kolay, anlaşılır bir şekilde erişmenin bir yoluna mı ihtiyacınız var? HIX AI'da deneyin! İşte bunu yapmanın üç basit adımı:
- HIX AI'nin Yapay Zeka sohbet platformunu ziyaret edin.
- Grok 3 modelini seçin.
- Modele istediğiniz her şeyi sorun ve anında yanıt alın.
Sorular ve Cevaplar
Grok 3, Grok 2'den nasıl farklı?
Grok 3, daha derin muhakeme, daha geniş bağlam pencereleri, daha sağlam gerçek zamanlı veri entegrasyonu ve gelişmiş verimlilik sunar. Ayrıca, gelişmiş düşünce zinciri işleme, hata düzeltme için geri izleme ve daha kapsamlı çok modlu girdiler sunar. Grok 2 ile karşılaştırıldığında, kullanıcılar genellikle daha hızlı muhakeme döngüleri ve uzun, karmaşık komutların daha iyi işlenmesini görürler.
Grok 3 hangi görevlerde en iyi?
Grok 3, karmaşık çok adımlı akıl yürütme ve problem çözme, gerçek zamanlı veri alma ve sentezi, çok modlu girdiler (metin, resim, ses) ve uzun bağlam anlayışı ve daha birçok görevde iyidir.
Grok 3 ne kadar doğru?
Grok 3, güncel gerçekleri iyileştirmek için geri çağırma desteğiyle muhakeme, olgusallık ve kodlama görevlerinde yüksek doğruluk elde etmek üzere tasarlanmıştır. Kıyaslama sonuçları göreve ve sürüme göre değiştiğinden, temel muhakeme ve geri çağırmada güçlü bir performans bekleyebilirsiniz; bazı görevler rakiplerle eşitlik veya uç durumlar sergiler.
Grok 3 ne kadar hızlı?
Raporlar, önceki Grok sürümlerine ve benzer üst düzey modellere kıyasla rekabetçi veya iyileştirilmiş gecikme süresine işaret ediyor ve performansın, akıl yürütme odaklı etkileşimlerde ve veri açısından zengin komutlarda daha hızlı yanıtlar için ayarlandığını belirtiyor. Kesin hızlar, dağıtıma, donanıma ve belirli göreve bağlıdır.


