Bu Yapay Zeka Ne Hissettiğinizi Sizden Daha İyi Biliyor

Elon Musk'ın yapay zeka şirketi xAI, yeni modeli Grok 4.1'in Grok'un web ve mobil sürümünün yanı sıra X'te de kullanıma açıldığını duyurdu. İşte detaylar!

⚡ Önemli Bilgiler

  • Elon Musk'ın yapay zeka şirketi xAI, Grok 4.1'i kullanıma sundu.
  • Yeni model, duyguları önceki sürümden çok daha iyi algılayabiliyor.
  • Bu model, halüsinasyon sorunlarını da önemli ölçüde azaltıyor.

Mevcut yapay zeka modelleri, genel sorulara yanıt vermekte iyi olabilir ancak ona gönderdiğiniz istemlerdeki asıl niyetinizi anlamakta her zaman başarılı değiller. Bir yazıyı hangi duygularla yazdığınızı anlamamaları ise alakasız şekillerde cevaplar vermesine neden oluyor. Elon Musk'ın kurduğu xAI tarafından sunulan yeni model Grok 4.1 ise tam da bu soruna odaklanarak kullanıcıların karşısına önemli bir avantajla beraber çıktı.

Grok 4.1'in Özellikleri Neler?

Elon Musk'ın sahibi olduğu X (eski adıyla Twitter) ile entegre çalışan yapay zeka modeli Grok, yeni yapay zeka modeli ile güncellendi. Bunun yanı sıra Grok'un web sitesi ve uygulaması üzerinden de erişilebilen yeni model, Grok'u birçok yönden iyileştirecek özelliklerle birlikte geliyor.

Yeni model artık kullanıcı niyetini çok daha iyi bir şekilde algılıyor. Kullanıcının bir kelime ile esasında ne kastetmek istediğini anlama konusunda diğer modellere göre daha üstün performans sergiliyor. Modelin duygusal zeka, empati ve benzeri yönlerden değerlendirildiği EQ-Bench testinde Grok 4.1 Thinking ilk sırada, Grok 4.1 ise ikinci sırada konumlandı.

Bu modelin arkasından Kimi K2 ve Horizon Alpha'dan sonra modelin en büyük rakipleri olarak görülen Gemini 2.5 Pro, GPT-5, Claude Opus 4 geldi. Yaratıcılık konusunda nasıl bir iş çıkardığını ortaya koymayı amaçlayan Create Writing v3 kıyaslamasında Grok 4.1 Thinking 1721.9 puanla ikinci, Grok 4.1 ise üçüncü sırada yer aldı.

Şu anda yapay zeka modellerinin önündeki en büyük sorunlardan biri halüsinasyon. Bu, modelin doğru olmayan şeyleri gerçekmiş gibi size sunmasına neden oluyor. Grok 4.1'in eğitim sürecinde ise halüsinasyon sorununun azaltılmaya çalışıldığı belirtildi. Akıl yürütme modunun devre dışı olduğu Grok 4, yüzde 9,89 FActScore puanı elde ederken Grok 4.1 ise yüzde 2.97 puan elde etti. Yanlış anlaşılmaya mahal vermemek adına düşük puanın daha iyi olduğunu belirtelim.

Evden Çıkmadan Önce Bu Yapay Zekayı Kullanmak İsteyeceksiniz
Yapay Zeka

Evden Çıkmadan Önce Bu Yapay Zekayı Kullanmak İsteyeceksiniz

Google, yeni hava durumu tahmini modeli WeatherNext 2'nin test sürecini sonlandırıp kullanıma sunmaya başladı. İşte modele dair tüm detaylar!

Modelin genel yeteneğinin değerlendirildiği LMArena kıyaslamasında Grok 4.1 Thinking 1483 puanla ilk sırada konumlandı. Onu da 1465 puanla akıl yürütme içermeyen normal Grok 4.1 modeli takip etti. Grok 4.1'i ise Gemini 2.5 Pro takip etti. Bu arada Google'ın çok yakın bir zamanda Gemini 3'ü kullanıma sunmaya başlaması bekleniyor.