Yapay Zeka Şirketi Cerebras'ın Kurucusu Andrew Feldman'ın Kariyerindeki Önemli Projeler Nelerdir?

📌 Özet

Yapay zeka çip devi Cerebras'ın kurucusu Andrew Feldman'ın kariyeri, veri merkezi verimliliğini yeniden tanımlayan SeaMicro ile başladı ve bu şirket 2012 yılında AMD tarafından 334 milyon dolara satın alındı. AMD bünyesinde Veri Merkezi Sunucu Çözümleri Genel Müdürü olarak görev yapan Feldman, burada edindiği tecrübeyle Moore Yasası'nın sınırlarını fark etti. Bu farkındalık, 2016 yılında yapay zeka hesaplamalarında devrim yaratma hedefiyle Cerebras Systems'ı kurmasına yol açtı. Şirketin en büyük başarısı, dünyanın en büyük çipi olan Wafer-Scale Engine (WSE) serisidir; 2024'te duyurulan WSE-3, 4 trilyon transistör ve 900.000 yapay zeka çekirdeği içeriyor. Feldman'ın vizyonu, BAE merkezli G42 ile yapılan ortaklıkla Condor Galaxy adlı, toplamda 9 exaflop hesaplama gücüne sahip bir yapay zeka süper bilgisayar ağı kurma projesiyle zirveye ulaştı. Bu projeler, Feldman'ı geleneksel GPU kümelerinin ötesinde, monolitik ve devasa ölçekli bilgi işlem mimarilerinin öncüsü olarak konumlandırıyor.

Yapay zeka şirketi Cerebras'ın kurucusu Andrew Feldman'ın kariyerindeki önemli projeler, temel olarak veri merkezi verimliliğini artıran SeaMicro, AMD'deki stratejik rolü ve yapay zeka hesaplamalarını kökten değiştiren Cerebras Systems'ın geliştirdiği Wafer-Scale Engine (WSE) çipleri etrafında şekillenmektedir. Feldman'ın yolculuğu, 2007'de kurduğu ve sunucuların güç tüketimini %75'e varan oranlarda azaltmayı hedefleyen SeaMicro ile başladı. Bu şirketin 2012'de 334 milyon dolara AMD'ye satılması, onun kariyerinde bir dönüm noktası oldu. Cerebras ile ise geleneksel GPU'ların binlercesinin bir araya gelerek çözmeye çalıştığı yapay zeka problemlerini, tek bir devasa çip üzerinde çözme vizyonunu hayata geçirdi. Bu projeler, onun donanım mimarisinde nasıl bir devrim yarattığını somut verilerle ortaya koyuyor.

Girişimcilikten Devlere: Andrew Feldman'ın İlk Büyük Projesi SeaMicro

Andrew Feldman'ın teknoloji dünyasındaki yükselişi, 2007 yılında kurucu ortağı olduğu SeaMicro şirketi ile başladı. O dönemde veri merkezleri, artan enerji maliyetleri ve fiziksel alan kısıtlamaları gibi ciddi sorunlarla karşı karşıyaydı. Geleneksel sunucu mimarileri, yüksek performans sunarken orantısız miktarda güç tüketiyor ve soğutma için devasa bütçeler gerektiriyordu. Feldman ve ekibi, bu probleme radikal bir çözümle yaklaştı. Amaçları, on binlerce düşük güçlü işlemciyi tek bir sistemde birleştirerek hem performansı korumak hem de enerji verimliliğini dramatik bir şekilde artırmaktı. Bu vizyon, veri merkezi ekonomisini temelden sarsma potansiyeli taşıyordu.

Düşük Güç Tüketimiyle Yüksek Yoğunluklu Sunucular

SeaMicro'nun geliştirdiği SM10000 gibi sistemler, Intel'in Atom gibi mobil cihazlar için tasarlanmış düşük güçlü işlemcilerini kullanarak bir sunucu kasasına yüzlerce çekirdek sığdırmayı başardı. Bu yaklaşım, geleneksel x86 sunucularına kıyasla güç tüketimini ve kaplanan alanı %75'e varan oranlarda azaltıyordu. Şirketin geliştirdiği özel ara bağlantı teknolojisi (fabric interconnect), bu çok sayıdaki işlemcinin birbiriyle verimli bir şekilde iletişim kurmasını sağlıyordu. Bu, o dönem için devrim niteliğindeydi çünkü veri merkezi operatörleri için en büyük gider kalemlerinden ikisi olan elektrik ve gayrimenkul maliyetlerini doğrudan hedef alıyordu. SeaMicro, birim watt başına düşen işlem gücünü maksimize ederek pazarda benzersiz bir konum elde etti.

Veri Merkezi Verimliliğinde Çığır Açan Yaklaşım

SeaMicro'nun getirdiği yenilik, sadece donanım seviyesinde kalmadı; aynı zamanda yazılım ve sistem yönetimi katmanlarını da içeriyordu. Geliştirdikleri teknoloji, yüzlerce ayrı sunucuyu tek bir mantıksal birim gibi yönetmeyi mümkün kılıyordu. Bu, sistem yöneticilerinin karmaşıklığını azaltırken operasyonel verimliliği artırdı. Şirketin bu bütüncül yaklaşımı, büyük teknoloji şirketlerinin dikkatini çekti. Feldman'ın liderliğindeki SeaMicro, kısa sürede mikro sunucu (microserver) pazarının en önemli oyuncusu haline geldi ve veri merkezi tasarımında yeni bir paradigmanın kapılarını araladı. Bu başarı, daha büyük bir oyuncunun sahneye çıkması için zemin hazırlıyordu.

AMD Dönemi: Sunucu Pazarını Yeniden Şekillendiren Stratejik Satın Alma

SeaMicro'nun pazardaki sarsıcı etkisi, işlemci devi AMD'nin dikkatinden kaçmadı. 2012 yılında AMD, sunucu pazarındaki en büyük rakibi Intel'e karşı elini güçlendirmek için SeaMicro'yu 334 milyon dolarlık bir anlaşmayla satın aldı. Bu hamle, AMD için sadece yeni bir teknoloji transferi değil, aynı zamanda veri merkezi stratejisini tamamen yeniden şekillendirecek bir adımdı. Andrew Feldman, bu satın almanın ardından AMD'ye katılarak Veri Merkezi Sunucu Çözümleri biriminin Genel Müdürü ve Kurumsal Başkan Yardımcısı oldu. Bu rolde, SeaMicro'nun yenilikçi teknolojisini AMD'nin küresel ölçeğiyle birleştirme görevini üstlendi.

SeaMicro Teknolojisinin AMD'ye Entegrasyonu

Feldman'ın AMD'deki öncelikli görevi, SeaMicro'nun patentli Freedom Fabric ara bağlantı teknolojisini ve yüksek yoğunluklu sunucu tasarımlarını AMD'nin Opteron işlemci ailesiyle entegre etmekti. Amaç, hem AMD'nin kendi işlemcilerini kullanan hem de rakip Intel işlemcilerini destekleyen ultra verimli sunucu çözümleri sunmaktı. Bu entegrasyon, AMD'nin müşterilerine daha önce sunamadığı bir esneklik ve maliyet avantajı sağladı. Feldman liderliğindeki ekip, AMD'nin sunucu pazarındaki ürün portföyünü genişleterek şirketin bulut bilişim ve büyük veri gibi hızla büyüyen alanlarda daha rekabetçi olmasını sağladı. Bu süreç, Feldman'a büyük bir şirketin kaynaklarını yönetme ve küresel pazarlama stratejileri geliştirme konusunda paha biçilmez bir deneyim kazandırdı.

Intel'e Karşı Rekabette Yeni Bir Cephe

AMD'nin SeaMicro'yu satın alması, Intel'in veri merkezi pazarındaki %90'ı aşan hakimiyetine doğrudan bir meydan okumaydı. Feldman'ın stratejisi, salt işlemci performansında rekabet etmek yerine, toplam sahip olma maliyeti (TCO) ve enerji verimliliği gibi alanlarda farklılaşmaktı. SeaMicro teknolojisi, AMD'ye bu yeni cephede savaşmak için gerekli silahları verdi. Her ne kadar AMD, bir süre sonra mikro sunucu stratejisinden vazgeçmiş olsa da, bu dönemde kazanılan bilgi birikimi ve Feldman'ın edindiği tecrübe, onun bir sonraki ve çok daha büyük projesinin temellerini atacaktı. AMD'de geçirdiği süre, ona mevcut işlemci mimarilerinin gelecekteki yapay zeka iş yükleri için yetersiz kalacağını net bir şekilde gösterdi.

Yapay Zekanın Sınırlarını Zorlamak: Cerebras Systems'ın Doğuşu

Andrew Feldman, AMD'deki görevinden sonra teknoloji endüstrisindeki bir sonraki büyük devrimin yapay zeka alanında olacağını öngördü. Ancak mevcut donanım mimarilerinin, özellikle de büyük dil modelleri (LLM'ler) gibi devasa yapay zeka modellerinin ihtiyaçlarını karşılamaktan uzak olduğunu fark etti. Geleneksel yaklaşım, binlerce ayrı Grafik İşlem Birimi'ni (GPU) birbirine bağlayarak büyük bir hesaplama kümesi oluşturmaktı. Bu yöntem, çipler arasındaki iletişimde ciddi darboğazlara (bottlenecks) ve muazzam bir programlama karmaşıklığına neden oluyordu. Feldman, bu problemi çözmek için 2016 yılında, donanım endüstrisinin duayenlerinden Gary Lauterbach ve Michael James gibi isimlerle birlikte Cerebras Systems'ı kurdu. Şirketin misyonu basitti ama bir o kadar da cüretkardı: Yapay zeka için sıfırdan, tamamen yeni bir bilgisayar mimarisi tasarlamak.

Moore Yasası'nın Sınırlarına Meydan Okuma Fikri

Cerebras'ın temel felsefesi, Moore Yasası'nın yavaşlamasıyla ortaya çıkan performans boşluğunu kapatmaktı. Yıllardır süregelen "daha küçük ve daha fazla transistör" yaklaşımı artık tek başına yeterli değildi. Feldman, "büyük ve tek parça" bir çözümün daha verimli olacağına inanıyordu. Fikir, binlerce küçük çipi bir araya getirmek yerine, üretilebilecek en büyük tek parça silikon levha (wafer) üzerine devasa bir çip inşa etmekti. Bu, çipler arası iletişimi ortadan kaldırarak gecikmeyi (latency) milisaniyelerden nanosaniyelere düşürecek ve yapay zeka modellerinin eğitimini haftalardan saatlere indirecekti. Bu vizyon, yarı iletken endüstrisinde 50 yıldır aşılamayan üretim zorluklarına meydan okumak anlamına geliyordu.

Yapay Zeka İçin Özel Donanım İhtiyacı

Yapay zeka modellerinin büyüklüğü katlanarak artıyordu. 2018'de 110 milyon parametreli BERT gibi modeller çığır açarken, 2020'de 175 milyar parametreli GPT-3 ortaya çıktı. Bu devasa modelleri eğitmek, Nvidia gibi şirketlerin ürettiği GPU kümeleriyle bile aylar sürebiliyordu. Feldman, bu sorunun temelden çözülmesi gerektiğini savundu. GPU'lar, grafik işleme için tasarlanmış ve sonradan yapay zekaya uyarlanmış araçlardı. Cerebras ise doğrudan yapay zeka ve derin öğrenme iş yükleri için optimize edilmiş, özel bir donanım (ASIC - Application-Specific Integrated Circuit) yaratmayı hedefledi. Bu, şirketin tüm kaynaklarını tek bir amaca odaklamasını sağladı: dünyanın en hızlı yapay zeka bilgisayarını inşa etmek.

Bir Devrimin Kalbi: Wafer-Scale Engine (WSE) Çiplerinin Gelişimi

Cerebras Systems'ın en somut ve devrimci projesi, Wafer-Scale Engine (WSE) adını verdiği çip serisidir. Bu proje, Andrew Feldman'ın yapay zeka donanımına dair radikal vizyonunun ete kemiğe bürünmüş halidir. Geleneksel çip üretiminde, büyük bir silikon levha üzerine yüzlerce küçük çip (die) basılır, ardından bu levha kesilerek çipler ayrılır ve paketlenir. Cerebras ise bu kesme işlemini atlayarak 300mm'lik bir silikon levhanın neredeyse tamamını tek bir devasa işlemci olarak kullanma yoluna gitti. Bu, daha önce kimsenin ticari olarak başaramadığı bir mühendislik harikasıydı ve yapay zeka hesaplamalarında bir paradigma değişimi yarattı.

WSE-1: Dünyanın En Büyük Çipi

2019 yılında tanıtılan ilk nesil Wafer-Scale Engine (WSE-1), duyurulduğu anda dünyanın en büyük çipi unvanını aldı. Yaklaşık 46.225 milimetrekarelik bir alana sahip olan bu çip, 1.2 trilyon transistör ve 400.000 yapay zeka için optimize edilmiş çekirdek içeriyordu. Karşılaştırma yapmak gerekirse, o dönemin en büyük GPU'su yaklaşık 815 milimetrekare alana ve 21 milyar transistöre sahipti. WSE-1, üzerindeki 18 gigabaytlık süper hızlı on-chip SRAM bellek sayesinde, tüm veriyi ve hesaplamayı tek bir silikon parçası üzerinde tutarak GPU kümelerinin en büyük sorunu olan iletişim gecikmesini ortadan kaldırdı. Bu, özellikle devasa sinir ağlarının eğitimi için benzeri görülmemiş bir hız ve verimlilik artışı anlamına geliyordu.

WSE-2 ve WSE-3: Trilyonlarca Transistörlük Güç

Feldman ve ekibi, WSE-1'in başarısının ardından durmadı. 2021'de tanıtılan WSE-2, aynı levha boyutunda transistör sayısını 2.6 trilyona ve çekirdek sayısını 850.000'e çıkararak kendi rekorunu kırdı. Mart 2024'te duyurulan WSE-3 ise bu çıtayı daha da yükseltti. TSMC'nin 5 nanometre üretim teknolojisiyle üretilen WSE-3, tam 4 trilyon transistör, 900.000 yapay zeka çekirdeği ve 44 GB on-chip SRAM belleğe sahip. Bu çip, tek başına 125 petaflop'luk bir tepe yapay zeka performansı sunuyor. Bu rakamlar, WSE-3'ün tek bir çip üzerinde yüzlerce yüksek performanslı GPU'nun gücünü barındırdığını gösteriyor ve bu da Feldman'ın vizyonunun ne kadar ileri görüşlü olduğunu kanıtlıyor.

Geleneksel GPU'lara Karşı Mimari Farklılıklar

WSE serisinin en temel farkı, hesaplama ve belleğin bütünleşik yapısıdır. Nvidia'nın H100 gibi GPU'ları, yüksek bant genişliğine sahip harici HBM belleğe güvenirken, Cerebras tüm belleği çekirdeklerin hemen yanına, çipin üzerine yerleştirir. Bu, bellek bant genişliğini 20 Petabytes/saniye gibi inanılmaz seviyelere çıkarır. Sonuç olarak, Cerebras sistemleri, binlerce GPU'nun birbirine bağlanmasını gerektiren karmaşık MPI (Message Passing Interface) kodlarına ihtiyaç duymadan, devasa modelleri çok daha basit bir programlama modeliyle eğitebilir. Bu mimari, özellikle veri paralelizmi yerine model paralelizminin gerektiği durumlarda ezici bir üstünlük sağlar.

Geleceğe Bakış: Condor Galaxy ve Yapay Zeka Süper Bilgisayarları Vizyonu

Andrew Feldman'ın kariyerindeki projeler, sadece donanım üretmekle sınırlı kalmadı; aynı zamanda bu donanımı kullanarak dünyanın en büyük problemlerini çözecek ölçekte sistemler kurma vizyonunu da içeriyor. Cerebras'ın WSE çipleriyle elde ettiği başarı, şirketi bir sonraki mantıksal adıma taşıdı: bu çipleri bir araya getirerek dünyanın en güçlü yapay zeka süper bilgisayar ağlarından birini oluşturmak. Bu vizyonun en somut örneği, BAE merkezli teknoloji holdingi G42 ile yapılan stratejik ortaklık sonucu ortaya çıkan Condor Galaxy projesidir. Bu proje, Feldman'ın sadece bir çip tasarımcısı değil, aynı zamanda küresel ölçekte bir bilişim altyapısı mimarı olduğunu gösteriyor.

G42 ile Stratejik Ortaklık

2023 yılında duyurulan Condor Galaxy projesi, Cerebras ve G42 arasında milyarlarca dolarlık bir iş birliğini temsil ediyor. Projenin amacı, her biri 4 exaflop (saniyede 10^18 işlem) AI hesaplama gücüne sahip dokuz adet süper bilgisayarı birbirine bağlamaktır. Bu ağ tamamlandığında, toplamda 36 exaflop'luk devasa bir güç sunacak. Bu ortaklık, Cerebras'a sadece finansal bir destek sağlamakla kalmadı, aynı zamanda teknolojisini ABD dışındaki stratejik bir pazarda, özellikle Orta Doğu'da konumlandırma fırsatı verdi. G42'nin bulut altyapısı ve veri uzmanlığı, Cerebras'ın donanım gücüyle birleşerek sağlık, enerji ve iklim değişikliği gibi alanlarda çığır açıcı yapay zeka modellerinin geliştirilmesine olanak tanıyor.

Exaflop Ölçeğinde Yapay Zeka Hesaplama Gücü

Condor Galaxy 1 (CG-1) adlı ilk süper bilgisayar, ABD'nin Kaliforniya eyaletinde faaliyete geçti ve 64 adet Cerebras CS-2 sisteminden oluşuyor. Bu sistem, tek bir makine olarak çalışarak 54 milyon çekirdekle 4 exaflop'luk bir performans sunuyor. Projenin nihai hedefi, bu gücü dokuz katına çıkarmaktır. Bu ölçekteki bir hesaplama kapasitesi, trilyonlarca parametreye sahip yeni nesil yapay zeka modellerinin haftalar veya aylar yerine günler içinde eğitilmesini mümkün kılacaktır. Feldman'ın bu projedeki rolü, tekil çip verimliliğinden, küresel ölçekte dağıtık bir süper bilgisayar ağının mimarisine geçişi simgeliyor. Bu, yapay zeka araştırmalarının ve ticari uygulamalarının önündeki en büyük engellerden biri olan hesaplama kıtlığını ortadan kaldırma potansiyeline sahip bir adımdır.

Andrew Feldman'ın kariyerindeki önemli projeler, onun teknoloji dünyasındaki statik kabullere meydan okuma arzusunu net bir şekilde ortaya koyuyor. SeaMicro ile veri merkezi verimliliğine getirdiği yenilikçi bakış açısı, AMD'de edindiği kurumsal tecrübe ve son olarak Cerebras ile yapay zeka donanımında yarattığı devrim, birbirini tamamlayan adımlar zinciridir. İlk adımınız olarak, kuruluşunuzun yapay zeka iş yüklerinin mevcut donanım altyapınızda yarattığı darboğazları analiz edebilirsiniz. 2026 ve sonrası için yapay zeka modellerinin karmaşıklığı artmaya devam edecek ve Cerebras gibi özel donanım çözümleri, Nvidia'nın GPU hakimiyetine ciddi bir alternatif oluşturacak. Gartner'ın 2025 raporuna göre, büyük ölçekli AI eğitimi için özel donanımların pazar payının %30'a ulaşması bekleniyor. Asıl soru şudur: Sizin organizasyonunuz, bu donanım devriminin getireceği rekabet avantajından yararlanmaya hazır mı, yoksa geleneksel mimarilerin sınırlamaları içinde mi kalacak? Bu dönüşümü erkenden benimseyenler, yalnızca inovasyon hızını artırmakla kalmayıp, aynı zamanda geleceğin teknoloji standartlarını belirleyenler arasında yer alacak.

BENZER YAZILAR