03 Temmuz 2026

Çin’in kendi çipleri ile ürettiği ilk açık model: LongCat-2.0

ABD'nin çip ambargosu Çin'i durdurmak yerine kendi yapay zekâ ekosistemini kurmaya itti. Meituan'ın LongCat-2.0 modeli, yerli işlemcilerle eğitilen trilyon parametre ölçekli sistemlerin artık mümkün olduğunu göstererek teknoloji rekabetinde yeni bir dönemin kapısını aralıyor.

Tercüman’da yayımlanan önceki yazılarımızda Amerika Birleşik Devletleri’nin yapay zekâ stratejisinden, gelişmiş yarı iletkenlere yönelik ihracat kısıtlamalarından ve teknolojiyi giderek yalnızca belirli ülkelerin, şirketlerin ve seçkin grupların erişebileceği kapalı bir güç alanına dönüştürme çabasından söz etmiştik. Son olarak Fable 5 modeli etrafında yaşanan tartışmalar üzerinden meselenin artık yalnızca donanımla sınırlı kalmadığını; yapay zekâ modellerinin kimler tarafından geliştirilebileceğinin, kimlere sunulacağının ve hangi düşünce sınırları içinde çalışacağının da siyasi kararlarla belirlenmeye başladığını değerlendirmiştik. (Modellerin yeniden erişime açılacağını da öğrendik.)

Aslında Amerika’nın en başından veri yapmak istediği şey; en gelişmiş çipleri, en güçlü modelleri ve bunların üretilebilmesi için gereken altyapıyı kontrol eden taraf olmak, yapay zekâ çağının standartlarını, ekonomik ve siyasi sınırlarını belirlemekti. Ancak teknoloji tarihinde yasakların her zaman beklenen sonucu doğurmadığına ilişkin sayısız örnek bulunuyor. Bazen kapatılan kapı, içeride yeni bir atölyenin kurulmasına neden oluyor. Buna bir örnek daha eklendi. 30 Haziran’da Çinli e-ticaret ve yemek teslimatı şirketi Meituan tarafından LongCat-2.0 isimli bir model duyuruldu. Modelin asıl önemi; kaç parametreye sahip olduğunda veya belirli testlerde hangi modelleri geçtiği değil, Çin tarafından geliştirilmiş donanımlar üzerinde eğitilmiş ve kabul edilebilir başarıya ulaşmış olması.

Meituan'dan yapay zekâ devrimi

Meituan’ın açıklamasına göre LongCat-2.0, yaklaşık 50 bin Çin üretimi yapay zekâ işlemcisinden oluşan bir küme üzerinde, baştan sona yerli donanımla eğitildi. Şirket, böylece trilyon parametre ölçeğindeki bir yapay zekâ sistemini Amerikan çiplerine dayanmadan eğitebildiğini ilan etti. Başka bir ifadeyle Amerika’nın Çin’e vermek istemediği şey, Çin’in kendi üretmek zorunda kaldığı şeye dönüştü.

Meituan; kamuoyunda daha çok yemek siparişi, restoran rezervasyonu, otel bulma ve yerel hizmetler alanında faaliyet gösteren bir platform olarak biliniyor. Batı dünyasındaki DoorDash benzeri şirketlerle karşılaştırılıyor. Bu nedenle ilk bakışta Meituan’ın dünyanın en büyük yapay zekâ modellerinden birini geliştirmesi şaşırtıcı görünebilir. Ancak Çin’de son yıllarda oluşan teknoloji ekosistemine yalnızca şirketlerin mevcut faaliyet alanları üzerinden bakmak yanıltıcı olur. Örneğin, Alibaba artık sadece bir e-ticaret şirketi değildir. ByteDance yalnızca kısa video üreten bir platform değildir. Huawei yalnızca telefon ve telekomünikasyon cihazları geliştiren bir şirket değildir. Bu şirketlerin neredeyse tamamı veri, bulut altyapısı, yarı iletken, yapay zekâ modeli ve otonom sistemler arasında dikey bir teknoloji zinciri kurmaya çalışıyor.

Meituan’ın LongCat ekibinin 2023 yılında kurulmuş olması ve ilk modelini ancak 2025’in sonlarına doğru yayımlaması, bu dönüşümün ne kadar hızlı gerçekleştiğini gösteriyor. Şirket şimdi 1,6 trilyon toplam parametreye sahip, her işlem sırasında yaklaşık 48 milyar parametreyi etkinleştiren bir Mixture-of-Experts, yani uzmanlar karışımı mimarisinden söz ediyor.

Bu mimaride modelin bütün parametreleri her soru için aynı anda çalıştırılmıyor. Soruya veya göreve göre belirli uzman katmanlar devreye giriyor. Böylece devasa bir modelin bilgi kapasitesi korunurken her işlemde kullanılan hesaplama miktarı azaltılabiliyor. Ayrıca modelin bir milyon token uzunluğundaki bağlamlarla çalışabilecek şekilde geliştirildiği ifade ediliyor. Bu kapasite, tek seferde çok uzun belgelerin, geniş yazılım projelerinin veya karmaşık görev zincirlerinin işlenebilmesi anlamına geliyor. Fakat tekrar vurgulamak gerekir: Buradaki temel hikâye, modelin büyüklüğü değildir; bu büyüklükte bir modelin Amerikan donanımı olmadan eğitilebilmiş olmasıdır.

Ambargonun görünmeyen sonucu

Amerika Birleşik Devletleri, 2022’den itibaren Çin’in gelişmiş yapay zekâ işlemcilerine erişimini sınırlayan kapsamlı ihracat kontrolleri uygulamaya başladı. Amaç, Çinli şirketlerin en ileri modelleri eğitmek için ihtiyaç duyduğu hesaplama gücüne ulaşmasını zorlaştırmaktı. Bu strateji kısa vadede etkili oldu. Nvidia’nın en gelişmiş işlemcilerinin Çin’e satışı sınırlandırıldı. Çin pazarı için performansı düşürülmüş özel ürünler geliştirildi. Daha sonra bu ürünlerin bir kısmı da yeni düzenlemelerin kapsamına alındı. Çinli şirketler, mevcut donanımlarını daha uzun süre kullanmak ve ulaşabildikleri işlemcilerden daha fazla verim elde etmek için farklı eğitim teknikleri geliştirmek zorunda kaldı.

Bu baskı aynı zamanda Çin’in yerli yarı iletken ekosistemine büyük bir ekonomik ve stratejik gerekçe sundu. Huawei ve Enflame Teknoloji gibi Çinli işlemci üreticileri, Amerikan şirketlerinin bıraktığı boşluğu doldurmaya başladı. Reuters’a göre LongCat-2.0’ın eğitimi de Çin’in Amerikan çiplerine bağımlılığını azaltmaya çalışan bu geniş çaplı dönüşümün önemli örneklerinden biri oldu. Meituan kullanılan işlemcinin üreticisini açıklamadı. Bu nedenle sistemin hangi Çinli şirketin çipleri üzerinde çalıştığını kesin olarak bilmiyoruz. Fakat o teknolojinin Çin sınırları içinde üretilebildiğini ve gerçek hayat problemlerini çözdüğünü artık biliyoruz.

Bir ülke 50 bin yerli işlemciden oluşan kümeyi kararlı biçimde çalıştırabiliyor, 35 trilyondan fazla token üzerinde eğitim gerçekleştirebiliyor ve bu süreçte geri alınamaz eğitim kayıpları yaşamadan trilyon parametre ölçeğine çıkabiliyorsa artık ortada yalnızca deneysel bir çip bulunmuyor demektir. Yani, ortada bir ekosistem vardır. Çip, tek başına yeterli değildir. Çipleri birbirine bağlayan yüksek hızlı ağ altyapısı gerekir. Bellek yönetimi gerekir. Derleyiciler, yazılım kütüphaneleri, hata toleransı ve dağıtık eğitim sistemleri gerekir. Binlerce işlemcinin haftalar veya aylar boyunca aynı görevi sürdürebilmesi gerekir. LongCat-2.0 bu nedenle yalnızca bir dil modeli değil, Çin’in yapay zekâ altyapısının stres testidir. Görünen o ki sistem bu testi geçti.

Kötü komşu mal sahibi yaptırdı

Türkçede “Kötü komşu insanı mal sahibi yapar” şeklinde güçlü bir söz vardır. Amerika Birleşik Devletleri’nin teknoloji ambargoları da Çin açısından benzer bir sonuç doğuruyor. Amerika Birleşik Devletleri, Çinli şirketlerin Nvidia işlemcilerine erişimini sınırlayarak onların yapay zekâ yarışında yavaşlayacağını düşündü. Kısa vadede bu hesap yanlış değildi. Çinli şirketlerin maliyetleri arttı, donanım seçenekleri daraldı ve bazı projeler gecikti. Fakat uzun vadede uygulanan baskı, Çin’in kendi işlemcisini, kendi yazılım altyapısını ve kendi yapay zekâ ekosistemini kurması için güçlü bir teşvik oluşturdu. Amerikan şirketlerine gelecekte rakip olabilecek yeni üreticiler de ortaya çıkardı.

Bugün Huawei’nin yapay zekâ işlemcileri Nvidia’nın bütün ürünleriyle aynı seviyede olmayabilir. Çin’in yarı iletken üretim teknolojileri bazı alanlarda hâlâ Batılı ve Tayvanlı üreticilerin gerisinde de olabilir. LongCat-2.0’ın performansına ilişkin iddiaların bağımsız testlerle doğrulanması da gerekir. Ancak stratejik yarışlarda her zaman ilk aşamada en iyi ürünü üretmek gerekmez. Önce bağımlılığı azaltacak kadar iyi bir ürün geliştirilir. Ardından iç pazar bu ürünü büyütür. Kullanım arttıkça yazılım ekosistemi gelişir, üretim ölçeği genişler ve performans farkı zamanla kapanır.

Çin’in avantajı da burada ortaya çıkıyor. Yüz milyonlarca kullanıcısı olan şirketler, devlet destekli sanayi politikası, geniş mühendislik kapasitesi ve devasa iç pazar aynı hedef etrafında birleştiğinde, başlangıçta verimsiz olan bir teknoloji kısa sürede stratejik bir alternatife dönüşebilir.

Açık model, kapalı teknoloji düzeni

LongCat-2.0 şu anda internet üzerinden kullanılabiliyor. Meituan ayrıca model ağırlıklarını GitHub ve Hugging Face üzerinden yayımlamayı planladığını belirtiyor. Resmî model sayfaları açılmış durumda; ancak ağırlık dosyaları henüz paylaşılmış değil. Bu ayrıntı da Çin ile Amerika arasında oluşmaya başlayan yaklaşım farkını göstermesi bakımından önemlidir.

Amerikan yapay zekâ şirketleri modellerini giderek daha kapalı hâle getiriyor. Eğitim verileri, model ağırlıkları, sistem mimarileri ve güvenlik kuralları ticari sır olarak saklanıyor. Kullanıcıya yalnızca şirketin izin verdiği ölçüde erişim sağlanıyor. Çinli şirketler ise en azından bazı modellerinde kaynak kodlarını veya model ağırlıklarını yayımlayarak küresel geliştirici topluluğuna ulaşmaya çalışıyor. Elbette burada romantik bir açıklık ideali aramamak gerekir. Çin de yapay zekâyı kendi siyasi, ekonomik ve güvenlik hedefleri doğrultusunda şekillendiriyor. Ancak açık modellerin küresel etkisi, yalnızca teknik performanslarıyla ölçülemez.

Bir modelin ağırlıkları yayımlandığında araştırmacılar onu kendi sistemlerinde çalıştırabilir, farklı dillere uyarlayabilir, geliştirebilir ve Amerikan bulut şirketlerine bağlı kalmadan kullanabilir. Böylece yapay zekâ alanındaki nüfuz, yalnızca en güçlü modeli üretmekle değil, başkalarının üzerine sistem kurabileceği bir temel sunmakla da genişler. Amerika yapay zekâ teknolojisini korumak için duvarlar örerken Çin bu duvarların dışında alternatif yollar, modeller ve donanımlar inşa ediyor. Duvar yükseldikçe alternatif yolun değeri artıyor.

Podcast

19 December 2023
Doç. Dr. Hasan T. Kerimoğlu
Darbeler, İhanetler ve İsyanlar
28:19
0:01

Url kopyalanmıştır...