Çıkışıyla büyük ses getiren ve ChatGPT, Gemini, Grok gibi yapay zekâ botlarına kıyasla çok düşük bir bütçeyle geliştirilen, hatta R1 modeliyle fark atan DeepSeek, yeni nesil modeli olan R2'yi geliştirirken duvara tosladı. Önüne çekilen en büyük duvar ise ABD ile devam eden büyük teknoloji savaşı oldu.

DeepSeek mühendisleri, R2 modelinin eğitiminde ülkenin en büyük çip üreticilerinden Huawei'nin donanımını kullanmak istedi. Bu oldukça cesur bir girişim olmasına rağmen ne yazık ki teknik darboğazlara takıldı. R2 modelinin ertelendiği böylece doğrulandı.

DeepSeek Eğitimi NVIDIA Çipleriyle Devam Edecek

Çin, yüksek donanımlarda halen dışa bağımlı olduğu için, ABD'nin ihracat konusunda getirdiği yasaklar şu an en yüksek seviyedeyken, yüksek kapasiteli yapay zekâ modellerini eğitemiyor. DeepSeek, bağımsızlığını kazanmak için Huawei'in geliştirdiği çiplerle yola çıktı. Bu tercih, Çin hükümetinin yerli teknolojiyi teşvik eden politikalarıyla uyumluydu. Ne var ki, model eğitimi sırasında sistemde kararlılık sorunları yaşandı.

Donanım sadece kapasitede değil, yazılım uyumluluğu konusunda da sınıfta kaldı. Sonuç olarak DeepSeek, eğitim sürecini daha önce olduğu gibi NVIDIA donanımına taşıdı. Yine de inference, yani eğitilmiş modelin çalıştırılması kısmında Huawei çipleri kullanılmaya devam edilecek.

DeepSeek R2 Ne Zaman Çıkacak?

DeepSeek, R2 Modelinin resmi duyurusu için Mayıs ayını seçmişti. Üstelik modelin yayına alınması da bu döneme denk geliyordu. Ancak yaşanan teknik aksaklıklar sebebiyle R2 modeli ertelendi. Yeni modelin hangi tarihe ertelendiği ise henüz belli olmadı. Kaybolan bu süre zarfında R2 eğitimleri devam edecek ve hazır olduğunda duyurusu yapılacak.