Silikon Vadisi şaşkın: Çinli yapay zeka şirketinden düşük bütçeyle büyük teknolojik hamle

Çinli küçük bir yapay zeka şirketi, ABD'nin tüm ticari engellemelerine karşın, düşük bütçeyle yeni bir yapay zeka teknolojisi üretti. Olay, Silikon Vadisi'nde hararetli tartışmalar başlattı.

Dış Haberler

Yayın Tarihi: 26.01.2025 , 12:41 Güncelleme Tarihi: 26.01.2025 , 22:31

Çinli küçük bir yapay zeka laboratuvarı, bu hafta, son teknoloji modelinin teknik tarifini açıklayarak sektör dünyasında şaşkınlık yarattı. Bu hamle, ABD'nin Çin'i yüksek teknoloji alanında engelleme çabalarına hamlelerine meydan okuma olarak yorumlanırken, şirketin yöneticisi de, Çin'de adeta bir ulusal kahramana dönüştü.

Hedge fon yöneticisi Liang Wenfeng tarafından kurulan DeepSeek, Pazartesi günü R1 modelini yayınladı. Şirket, yayınladığı ayrıntılı bir makalede, insan gözetimi olmadan otomatik olarak öğrenebilen ve kendini geliştirebilen, önyüklemeli bir bütçeyle büyük bir dil modelinin nasıl oluşturulacağını açıkladı.

Silikon Vadisi'nde panik

OpenAI ve Google DeepMind gibi ABD şirketleri, modelleri insan bilişsel yetenekleriyle eşleştirmeye çalışan, yeni bir yapay zeka araştırma alanı olan akıl yürütme modellerinin gelişmelerine öncülük ediyordu. Aralık ayında, San Francisco merkezli OpenAI, o1 modelinin tam sürümünü yayınlamış ancak yöntemlerini gizli tutmuştu.

DeepSeek'in R1 sürümüyse, Meta ve Anthropic gibi daha iyi kaynaklara sahip ABD yapay zeka şirketlerinin teknik üstünlüklerini koruyup koruyamayacakları konusunda Silikon Vadisi'nde hararetli tartışmalar başlattı.

Sektör dünyasında bu başarı beklenmiyordu

Bu arada, Liang ülkesinde ulusal gururun odak noktası haline geldi. Bu hafta, ülkenin başbakanı Li Qiang ile girişimcilerin halka açık bir toplantısına katılmak üzere seçilen tek yapay zeka lideriydi. Toplantıda, girişimcilere "temel çekirdek teknolojileri aşmak için çabalarını yoğunlaştırmaları" söylendi.

Liang, 2021'de niceliksel ticaret fonu High-Flyer'ı yönetirken yapay zeka yan projesi için binlerce Nvidia modeli grafik işleme birimi satın almaya başlamıştı. Sektör içinden kişiler bunu "yeni bir hobi arayan bir milyarderin eksantrik eylemleri" olarak görmüştü.

Liang'ın yapay zeka alanında bir yabancı olarak statü kazanması beklenmiyordu. Liang, High-Flyer'da, hisse senedi fiyatlarını etkileyebilecek kalıpları belirlemek için yapay zeka ve algoritmalar kullanarak bir servet kazandı. Ekibiyse, hisse senedi ticareti yaparak para kazanmak üzere Nvidia çiplerini kullanmada ustalaştı. 2023'te de DeepSeek'i piyasaya sürerek insan seviyesinde yapay zeka geliştirme niyetini duyurdu.

ABD'nin ticari engellemelerine rağmen

Washington, Nvidia'nın en güçlü çiplerini Çin'e ihraç etmesini yasakladıktan sonra, Çinli yapay zeka şirketleri sınırlı sayıda kıyıdaki çipin işlem gücünü en üst düzeye çıkarmak için yenilikçi yollar bulmak zorunda kaldı. Şirkete yakın yapay zeka uzmanlarına göre, Liang'ın ekibi, bu sorunu nasıl çözeceğini zaten biliyordu.

Tüm mali kaynaklar araştırmaya yatırılıyor

Sektör içinden kişiler, DeepSeek'in araştırmaya odaklanmasının onu tehlikeli bir rakip haline getirdiğini söylüyor. Bunun nedeni olarak, şirketin buluşlarını ticari kazançlar için saklamak yerine paylaşmaya istekli olması gösteriliyor. DeepSeek'ın dış fonlardan para toplamadığına veya modellerini paraya çevirmek için önemli hamleler yapmadığına dikkat çekiliyor.

DeepSeek'in araştırmalarına bizzat katılan Liang, hedge fon ticaretinden elde ettiği geliri en iyi yapay zeka yeteneklerine en yüksek maaşları ödemek için kullanıyor. TikTok sahibi ByteDance ile birlikte DeepSeek, Çin'deki yapay zeka mühendislerine verilebilecek en yüksek ücreti vermesiyle biliniyor. Şirket personeli, Hangzhou ve Pekin'deki ofislerde bulunuyor.

Liang, DeepSeek'i ABD kurumlarından uzmanlar yerine, Pekin, Tsinghua ve Beihang üniversiteleri gibi en iyi Çin okullarından doktora derecesi almış uzmanlardan oluşan, benzersiz bir "yerel" şirket olarak tanımlıyor.

Liang, geçtiğimiz yıl yerel basına verdiği bir röportajda, çekirdek ekibinde yurtdışından dönen kimse olmadığını belirterek, "Hepsi yerel . . . En iyi yetenekleri kendimiz geliştirmeliyiz" demişti.

Mali dezavantajlar hâlâ mevcut, ABD'li şirketler karşı hamle çabasında

Diğer yandan, DeepSeek, 671 milyar parametreli bir modeli eğitmek için sadece 2 bin 48 adet Nvidia H800 ve 5,6 milyon dolar kullandığını iddia etti. Bu, OpenAI ve Google'ın benzer büyüklükteki modelleri eğitmek için harcadığı miktarın çok altında.

Sektör içinden kişiler, DeepSeek'in sınırlı kaynaklarla etkileyici sonuçlar göstermesine rağmen, sektör geliştikçe rekabetçi olmaya devam edip edemeyeceğinin açık bir soru olduğunu söylüyor.

Şirketin ABD'li rakipleriyse, Nvidia'nın yeni nesil Blackwell çiplerinden oluşan mega "kümeler" oluşturuyorlar. ABD'li şirketlerin, Çinli rakiplerle bir kez daha performans farkı yaratma amaçlı bilgi işlem gücü yaratmaya başladığı söyleniyor.

Bu hafta OpenAI, Japonya'nın SoftBank'ıyla Stargate adlı bir ortak girişim kurduğunu ve ABD'de AI altyapısına en az 100 milyar dolar harcamayı planladığını duyurdu. Elon Musk'ın yapay zeka programı xAI de, Grok AI modellerini eğitmeye yardımcı olmak için Colossus bilgisayarını 1 milyondan fazla GPU (grafik işlem birimi) içerecek şekilde büyük ölçüde genişletiyor.

ABD’nin yapay zekâ hamlesi ne anlama geliyor?

soL YZ Beta, soL’un geliştirdiği ve soL arşiviyle çalışan bir yapay zeka robotudur. Kullanımı, soL abonelerine açıktır.