ABD’nin Çip Kısıtlamalarına Rağmen Çin'in Yapay Zeka Teknolojisi Nasıl Gelişiyor?
Ve ABD bu konuda ne yapmalı?
Orijinal Adı; ‘‘How China Is Advancing in AI Despite U.S. Chip Restrictions’’
Yazar & Yayım: Harry Booth, Time
İlk Yayın Tarihi: 8 Ocak 2025
Çeviren ve Yayıma Hazırlayan: Uğur B.Tezgel
***
2017 yılında Pekin, 2030 yılına kadar küresel liderliği ele geçirmeyi hedefleyen iddialı bir yapay zeka geliştirme yol haritasını açıkladı. 2020 yılına kadar, planlanan yapay zekada "ikonik ilerlemeler" idi. Ancak 2022'nin sonlarında OpenAI’nin ChatGPT’yi piyasaya sürmesi dünyayı şaşırttı ve Çin’i hazırlıksız yakaladı.
O dönemde, önde gelen Çinli teknoloji şirketleri, Çin’in teknoloji sektöründen yaklaşık 1 trilyon dolar silen 18 aylık bir hükümet baskısının etkilerini atlatmaya çalışıyordu. Bir avuç Çinli yapay zeka sohbet robotunun kamuya açık olarak piyasaya sürülmesi için hükümet onayı alması neredeyse bir yıl aldı. Bazıları, Çin’in sansür konusundaki tutumunun ülkenin yapay zeka hedeflerini engelleyip engellemeyeceğini sorguladı.
Bu esnada ChatGPT’nin piyasaya sürülmesinden sadece bir ay önce açıklanan Biden yönetiminin ihracat kontrolleri, Çin’i büyük ölçekli yapay zeka modellerini eğitmek için gerekli olan ileri seviye yarı iletkenlerden mahrum bırakmayı amaçlıyordu. En son teknoloji çipler olmadan Pekin’in 2030 yılına kadar yapay zeka üstünlüğü hedefine ulaşması giderek daha zor görünüyordu.
Ancak bugüne geldiğimizde Çin’den gelen bir dizi etkileyici ürün, ABD’nin yapay zeka alanındaki liderliğinin azaldığını gösteriyor.
2024’ün Kasım ayında Alibaba ve Çinli yapay zeka geliştiricisi DeepSeek, bazı ölçütlere göre OpenAI’nin GPT-4’üne rakip olan akıl yürütme modellerini piyasaya sürdü. Aynı ay içerisinde Çinli video oyun devi Tencent, şirketin testlerine göre ABD’de geliştirilen en iyi açık kaynaklı modelleri birkaç kriterde geride bırakan Hunyuan-Large adlı açık kaynaklı bir model tanıttı. Akabinde 2024 yılının son günlerinde DeepSeek, DeepSeek-v3’ü piyasaya sürdü. Bu model, popüler bir çevrimiçi liderlik tablosunda açık kaynaklı yapay zeka olarak en üst sırada yer alıyor ve OpenAI ve Anthropic’in en iyi performans gösteren kapalı sistemleriyle başa baş mücadele ediyor.
EN: Okuduğunuz makalenin yayımlanmasından kısa bir süre sonra kendi açık kaynak kodlu ve tamamen ücretsiz erişime açık yeni modeli olan DeepSeek-R1 ile hem duyurulan maliyetler açısından, hem performans analizleri açısından dünya gündemine bomba gibi düştü.
DeepSeek R1 modeli duyurulduktan sonra Amerikan ana akım haber yayınlarından bir örnek
DeepSeek-v3 piyasaya sürülmeden önce bu trend Google’ın eski CEO’su ve ABD’nin yapay zeka politikası üzerindeki en etkili seslerinden biri olan Eric Schmidt’in dikkatini çekmişti. Schmidt, Mayıs 2024’te ABD’nin yapay zeka alanında “bu benim kitaplarımda bir sonsuzluk” olarak tanımladığı iki ila üç yıllık bir üstünlüğünü koruduğunu güvenle ifade etmişti. Ancak Kasım ayında, Harvard Kennedy School’da yaptığı bir konuşmada Schmidt, fikrini değiştirmiş olarak karşımızdaydı. Alibaba ve Tencent’ten gelen gelişmeleri, Çin’in arayı kapattığının kanıtı olarak göstermişti. “Bu beni çok şaşırttı,” dedi. “Çipler üzerinde koyduğumuz kısıtlamaların onları geride tutacağını düşünmüştüm.”
Ulusal prestijin ötesinde yapay zeka liderliği, küresel güç dengesi üzerinde büyük etkiler yaratabilir. Eğer yapay zeka ajanları, iş gücünün büyük bir bölümünü otomatikleştirebilirse, bu durum ülkelerin ekonomilerine katkı sağlayabilir. Ayrıca, gelecekte silahları yönlendirebilen ya da düşmanları hackleyebilen sistemler, belirleyici bir askeri avantaj sağlayabilir. İki süper güç arasında kalan ülkeler, Çin veya Amerikan yapay zeka sistemleri arasında seçim yapmaya zorlanırken yapay zeka küresel nüfuz için güçlü bir araç olarak ortaya çıkabilir. Çin’in hızlı ilerlemeleri, ABD’nin yarı iletkenler üzerindeki ihracat kontrollerinin Amerika’nın üstünlüğünü sürdürmeye yetip yetmeyeceği konusunda sorular doğuruyor.
Daha güçlü yapay zeka (AI) sistemleri geliştirmek, üç temel bileşene bağlıdır: Veri, yenilikçi algoritmalar ve ham işlem gücü (compute). GPT-4o gibi büyük dil modellerinin eğitim verileri genellikle internetten toplanır, yani bu veriler dünya genelindeki geliştiriciler için erişilebilirdir. Benzer şekilde algoritmalar veya AI sistemlerini iyileştirmeye yönelik yeni fikirler, akademik makalelerde paylaşıldığı için sınırları kolayca aşar. Paylaşılmasalar bile Çin, ABD'den daha fazla sayıda üst düzey AI araştırmacısı yetiştirerek bu alanda önemli bir insan kaynağına sahiptir. Buna karşılık gelişmiş yongalar (çipler) üretilmesi son derece zor olan fiziksel ürünlerdir ve algoritmalar veya verinin aksine sınırlarda engellenebilir.
Gelişmiş yarı iletkenlerin tedarik zinciri, ABD ve müttefikleri tarafından domine edilmektedir. ABD merkezli Nvidia ve AMD şirketleri, AI için kullanılan veri merkezi GPU'larında etkin bir tekel konumundadır. Bu çiplerin tasarımları o kadar karmaşıktır ki (transistör boyutları tek haneli nanometre ölçeğindedir) ve şu anda yalnızca Tayvan merkezli TSMC şirketi bu en üst seviye yongaları üretebilmektedir. TSMC'nin bu üretimi yapabilmesi için ise Hollandalı ASML şirketinin ürettiği milyonlarca dolarlık makinelere ihtiyaç vardır.
ABD, bu avantajını kullanmaya çalışmaktadır. 2022'de Biden yönetimi, Çin'e en gelişmiş yongaların satışını engelleyen ihracat kontrollerini devreye aldı. Bu hamle, Trump’ın ilk başkanlık döneminde başlatılan ve Çin'in yonga üretim teknolojilerine erişimini kısıtlamayı hedefleyen bir dizi önlemin devamı niteliğindeydi. Bu çabalar yalnızca gelişmiş yongaların Çin'e akışını engellemekle kalmadı, aynı zamanda ülkenin yerli yonga endüstrisini de zayıflattı. ABD Ticaret Bakanı Gina Raimondo, Nisan ayında 60 Minutes programına verdiği röportajda, "Çin'in yongaları yıllarca geride" ifadelerini kullanmıştı.
Ancak 2022 ihracat kontrolleri daha duyurulmadan ilk engelle karşılaştı ve Çin'deki geliştiricilerin yakında kısıtlanacak çipleri stokladığı rapor edildi. OpenAI'nin O1-önizlemesine rakip olan R1 adlı yapay zeka akıl yürütme modelinin arkasındaki Çinli geliştirici DeepSeek, ihracat kontrolleri uygulamaya konmadan bir yıl önce, yasaklanma kararı olan 10.000 Nvidia A100 GPU'dan oluşan bir set oluşturmuştu.
Kaçakçılık da ihracat kontrolünün etkinliğini zayıflatmış olabilir. Ekim ayında Reuters, Çin şirketi Huawei tarafından üretilen bir üründe kısıtlı TSMC çiplerinin bulunduğunu bildirdi. Çinli şirketlerin de Çin dışındaki paravan şirketleri kullanarak kısıtlı çipleri satın aldıkları bildirildi. Diğerleri ise offshore bulut sağlayıcılarından GPU erişimi kiralayarak ihracat kontrollerini atlattı. Aralık ayında The Wall Street Journal, ABD'nin Çin'in diğer ülkeler üzerinden çiplere erişimini sınırlayacak yeni önlemler hazırladığını bildirdi.
ABD ihracat kontrolleri Çin'in en ileri teknoloji yarı iletkenlere erişimini kısıtlarken, daha az güçlü çiplerin satışına hala izin veriyor. Hangi çiplere izin verilip verilmeyeceğine karar vermek zor bir süreç hâlini aldı. Nvidia, 2022 yılında amiral gemisi çipinin tasarımını değiştirerek Çin pazarı için kısıtlamaların eşik değerlerine uygun bir versiyon yarattı. Çipin yapay zeka geliştirme için hala kullanışlı olması, ABD'nin Ekim 2023'te kısıtlamaları sıkılaştırmasına neden oldu.
RAND şirketinin Teknoloji ve Güvenlik Politikaları Merkezi'nde yapay zeka ve hesaplama konusunda çalışan Lennart Heim, “Çin'in temelde aynı derecede iyi olan çipleri satın alabileceği bir yıl geçirdik” diyor. Heim'e göre bu bir boşluk doğuruyor; ona göre, henüz bu ihracat kontrollerinin Çin'in YZ atılımı üzerinde tam bir etki yaratmış olduğunu söyleyemeyiz.
Açıkcası ABD’nin Çin’e karşı uyguladığı kısıtlamalara dair, mevcut haliyle eşik değerinin iki ülke arasında doğru dengeyi sağlayıp sağlamadığı henüz belirsizliğini korumaktadır.
2024 Kasım ayında Tencent, çeşitli kıyaslama ölçütlerinde Meta’nın en güçlü Llama 3.1 varyantını geride bırakan Hunyuan-Large adlı bir dil modeli yayımladı. Kıyaslama ölçütleri, yapay zeka modellerinin genel zekasını değerlendirmek için kusurlu bir yöntem olsa dahi Hunyuan-Large’ın performansı dikkat çekicidir; zira Berkeley Risk ve Güvenlik Laboratuvarı’nın araştırmasına göre bu model, daha düşük performanslı ve kısıtlamasız Nvidia H20 GPU’ları kullanılarak eğitilmiştir. Araştırmanın yazarı ve Savunma Bakanlığı Savunma Yenilik Birimi’ne danışmanlık yapan Ritwik Gupta, “Donanımdan çok daha verimli faydalanıyorlar; bu, yazılımın üstünlüğünden kaynaklanıyor” ifadelerini kullanmıştır. Rakip Çin laboratuvarının geliştirdiği ve mevcut en güçlü açık kaynaklı model olduğu düşünülen DeepSeek-v3 de şaşırtıcı derecede az işlem gücüyle eğitilmiştir.
Seçilmiş Başkan Donald Trump’ın yapay zeka rekabetine dair Kasım ayında TIME’a konuşan uzmanların çoğu, ihracat kısıtlamalarının devam edeceğini hatta genişletileceğini öngörmüştür. Aralık ayında yeni kısıtlamalar getirilmeden önce Çinli şirketler, yeniden engellenecek çipleri stoklamış durumdalar.
Gupta, “Bu stratejinin tamamen gözden geçirilmesi gerekiyor. Donanım çipleriyle sürekli yeni sorunlarla mücadele etmekten vazgeçilmeli” diyerek, büyük dil modellerinin gelişimini yavaşlatmak yerine ABD’nin askeri yapay zeka sistemlerinin geliştirilmesini engellemeye odaklanmasını önermektedir. Gupta, bu sistemlerin eğitimi için genellikle daha az işlem gücüne ihtiyaç duyulduğunu belirtmiştir. Bununla birlikte, çip tedarik zincirinin diğer unsurlarına (örneğin ASML’in çip üretim makineleri) getirilen kısıtlamaların Çin’in yerli çip endüstrisini yavaşlatmada kritik rol oynadığını da kabul etmektedir.
Heim, geçtiğimiz yıl ABD'nin öncülüğünün azaldığını belirtmekle birlikte, Çin'in şu anda ABD'nin en iyi açık kaynak modelleriyle eşitlense bile, bu modellerin en üst seviye kapalı modellerden yaklaşık bir yıl geride kaldığını ifade etmekteydi. Heim, aradaki farkın kapanmasının otomatik olarak ihracat kontrollerinin başarısız olduğu anlamına gelmediğini vurgulayarak, "İhracat kontrollerinin işe yarayıp yaramadığı ikileminden uzaklaşmalıyız" demiş ve Çin'in bu kısıtlamaların etkisini hissetmesinin zaman alabileceğini de eklemiştir.
Son on yılda, yapay zeka modellerinin eğitimi için kullanılan işlem gücünde baş döndürücü bir artış gözlemlenmiştir. Örneğin, 2023'te yayımlanan OpenAI’ın GPT-4 modelinin eğitiminde, 2019'da çıkan GPT-2'ye kıyasla yaklaşık 10.000 kat daha fazla işlem gücü kullanıldığı tahmin edilmektedir. X ve Amazon gibi Amerikan şirketlerinin, yüz binlerce GPU ile donatılmış devasa süper bilgisayarlar inşa etmesiyle bu eğilimin süreceğine dair işaretler bulunmaktadır.
Bu gelişmelerin devam etmesi halinde, Heim, ABD'nin çip ihracat kısıtlamalarının Çin'in yapay zeka geliştirmede tempo tutmasını engelleyeceğini öngörmektedir. "İhracat kontrolleri öncelikle niceliği hedef alır" diyen Heim, kısıtlı çiplerin bir kısmının Çinli geliştiricilere ulaşsa bile, sayılarının azaltılmasının modellerin geniş ölçekte eğitilmesini ve dağıtılmasını zorlaştırdığını belirtmiştir. Heim, "İşlem gücünün önemini koruması koşuluyla, ihracat kontrollerinin zamanla daha sert etkiler yaratacağını düşünüyorum" şeklinde eklemiştir.
Carnegie Uluslararası Barış Vakfı’nın Teknoloji ve Uluslararası İlişkiler Programı’nda misafir araştırmacı Scott Singer ise Washington içinde "şu anda Çin'i müzakere masasına getirme konusunda bir tereddüt var" ifadelerini kullanmıştır.
Örtük mantık şudur: "[ABD öndeyse] neden herhangi bir şey paylaşalım?"
Ancak Singer, yapay zeka konusunda Çin ile müzakere etmek için zorlayıcı nedenler olduğunu da vurgulamakta: "Çin'in felaket riski kaynağı olması için lider olması gerekmez" diyen Singer, işlem gücü kısıtlamalarına rağmen Çin'in ilerleme kaydetmesinin, bir gün tehlikeli yeteneklere sahip yapay zeka üretme potansiyeli taşıdığını belirtmiştir. Singer, "Çin çok daha yakın bir seviyeye gelirse, her iki tarafın sistemlerinin güvende kalmasını sağlamak için ne tür diyaloglar kurulması gerektiğini düşünün" şeklinde uyarıda da bulunmakta.