Anthropic'in En Güçlü Modelleri Neden Kısıtlandı? Perde Arkasındaki Sebep Ortaya Çıktı
Anthropic'in en yeni yapay zekâ modelleri Fable 5 ve Mythos 5 kısa süre önce erişime engellenmişti. Şimdi bu kısıtlamaya sebep olan rapor ortaya çıktı.
⚡ Önemli Bilgiler
- Anthropic'in Fable 5 ve Mythos 5 modellerine getirilen erişim kısıtlamasının arkasında Amazon'un hazırladığı ve modellerin bazı istemlerle normalde vermemesi gereken yanıtlar üretebildiğini öne süren bir siber güvenlik raporu olduğu söyleniyor.
- ABD hükümeti rapordaki bulguların bir kısmını jailbreak olarak değerlendirirken, Anthropic bu görüşe katılmıyor. Benzer sonuçların GPT 5.5 dahil birçok gelişmiş yapay zekâ modelinde de elde edilebildiğini ifade ediyor. Anthropic'in görüşü bazı siber güvenlik uzmanları tarafından da destekleniyor.
- Anthropic'in Fable 5 ve Mythos 5 modellerinin ne zaman tekrardan erişime açılacağı bilinmiyor.
Yapay zekâ devi Anthropic, geçtiğimiz günlerde Fable 5 ve Mythos 5 isimli yeni modellerini duyurmuş ve kullanıma sunmuştu. Akıl yürütme başta olmak üzere görsel analiz ve yazılım geliştirme gibi birçok açıdan üst düzey performans sunan modeller büyük ilgiyle karşılandı.
Ancak ABD hükümetinin isteği doğrultusunda bu modellere kısa süre önce erişim kısıtlaması getirildi. Dikkat çeken bu kararın arkasındaki neden oldukça merak ediliyorken, ortaya çıkan yeni bilgiler bu soru işaretini ortadan kaldırdı.
Anthropic Neden Fable 5 ve Mythos 5 Erişimini Kesti?
Anthropic'in Fable 5 ve Mythos 5 modellerine erişimi kendi kararıyla değil, ABD hükümetinin talebiyle kısıtladığını söylemiştik. Yeni ortaya çıkan bilgilere göre hükümetin bu kararı almasının arkasında ise Amazon tarafından hazırlanan bir siber güvenlik raporunun olduğu söyleniyor.
Söz konusu raporda yeni Claude modellerinin özel istemler (prompt'lar) kullanılarak normalde vermemesi gereken bazı yanıtları üretebildiği öne sürülüyor. ABD hükümetinin ise rapordaki bazı bu bulguları "jailbreak" olarak değerlendirdiği belirtiliyor. Bilmeyenler için jailbreak, kullanıcıların belirli istemler aracılığıyla yapay zekâ modelinin güvenlik duvarlarını aşarak normal şartlarda yanıt vermemesi gereken sorulara cevap alabilmesi anlamına geliyor. Amazon'un raporuna göre Fable 5 ve Mythos 5 modelleri üzerinde yapılan testlerde modellerin siber saldırılarda kullanılabilecek bazı bilgileri üretebildiği görüldü.
Bildiğiniz üzere yapay zekâ modelleri, özellikle güvenlik ve yasa dışı işlerle ilgili sorulara doğrudan yanıt veremiyor. Örneğin popüler sohbet botlarından Gemini'a "tamindir.com web sitesini nasıl çökertebilirim?" şeklinde bir soru sorduğunuzda bunun yasa dışı bir eylem olduğunu ve hatta yasal sonuçlar ile karşı karşıya kalabileceğinizi belirtiyor. Kısacası sorunun net cevabını vermekten kaçınıyor.
Amazon'un raporundaysa Fable 5 ve Mythos 5'in normalde yanıt vermemesi gereken bazı sorulara cevap üretebildiği iddia ediliyor. Peki Anthropic cephesi bu rapor hakkında ne düşünüyor?
Anthropic, Amazon'un Raporuna Karşı Ne Diyor?
Anthropic, Amazon tarafından hazırlanan raporun ortaya çıkmasının ardından konuyla ilgili bir açıklama yaptı. Şirket, rapordaki bulguların abartıldığını ve ABD hükümetinin bunları doğrudan jailbreak olarak değerlendirmesine katılmadığını belirtti. Anthropic'e göre raporda gösterilen jailbreak yöntemleri yalnızca Fable 5 ve Mythos 5'e özgü değil. Benzer sonuçların OpenAI'ın GPT 5.5 modeli de dahil olmak üzere birçok gelişmiş yapay zekâ modelinde elde edilebildiği söyleniyor.
Öte yandan bazı siber güvenlik uzmanları da Anthropic'i destekliyor. Büyük güvenlik şirketlerinden LutaSecurity'nin CEO'su Katie Moussouris, raporu incelediğini ve yer alan buguların teknik açıdan bir jailbreak olmadığını açıkladı. Benzer şekilde bazı güvenlik uzmanları da aynı düşüncede.
Anthropic, Modellerini Tekrardan Erişime Açabilir mi?
Anthropic, ABD hükümetiyle aynı görüşü paylaşmadığını açıkça belirtmişti. Bu nedenle iki taraf arasında konuyla ilgili görüşmeler yapılması bekleniyor. Görüşmelerin sonucunda Fable 5 ve Mythos 5 için uygulanan kısıtlamalar kaldırılabilir. Ancak mevcut engelin aynen devam etmesi ihtimali de var.
Öte yandan ABD hükümeti raporda belirtilen güvenlik sorunlarının giderilmesi karşılığında kısıtlamayı kaldırmayı teklif edebilir. Kısacası şu anda neler olacağı belirsizliğini koruyor.
Editörün Yorumu
Aslına bakacak olursak yapay zekâ modellerinde jailbreak konusu uzun süredir gündemde. Ben de geçen yıl OpenAI'ın bazı GPT modellerinde bir jailbreak denemesi yapmış ve başarılı olmuştum. GPT'de sanki bir admin modunu etkinleştiren, tüm kısıtlamaların ve güvenlik duvarlarının kaldırılması gerektiğini belirten bir prompt denemiştim. Anthropic'in yeni modellerini de kullanıma sunulur sunulmaz kurcalamış ve oldukça başarılı bulmuştum. Umarım yakın zamanda yeniden erişime açılırlar.