Core CPU Arm Server Generasi Berikutnya

Kurang dari empat tahun yang lalu, Arm mengumumkan rangkaian desain CPU infrastruktur Neoverse mereka. Memutuskan untuk melipatgandakan pasar server dan komputasi edge dengan merancang inti CPU Arm khusus untuk pasar tersebut – dan tidak hanya mendaur ulang desain Cortex-A yang berfokus pada konsumen – Arm set untuk menangani pasar infrastruktur dengan cara yang jauh lebih agresif. Upaya tersebut, pada gilirannya, semakin membuahkan hasil yang baik bagi Arm dan mitranya, yang berkat produk seperti Graviton Amazon dan CPU Ampere Altra akhirnya dapat mengambil bagian yang berarti dari pasar CPU server.

Tetapi karena CPU Arm akhirnya mencapai penetrasi pasar yang tidak mereka capai dalam dekade sebelumnya, Arm perlu memastikan bahwa ia tidak berpuas diri. Dari tiga lini desain inti Neoverse perusahaan – E yang efisien, N fleksibel, dan V berkinerja tinggi – perusahaan tersebut telah menggunakan inti N generasi kedua, yang dengan tepat disebut N2. Sekarang, perusahaan sedang bersiap untuk memperbarui sisa jajaran Neoverse dengan core V dan E generasi berikutnya juga, hari ini mengumumkan core Neoverse V2 dan Neoverse E2. Kedua desain ini dijadwalkan untuk membawa arsitektur Armv9 ke HPC dan pelanggan server lainnya, serta peningkatan kinerja yang signifikan.

Arm Neoverse V2: Armv9 Menghadirkan Komputasi Berkinerja Tinggi

Memimpin biaya untuk IP inti CPU baru Arm adalah desain seri-V generasi kedua perusahaan, Neoverse V2. Platform V2 lengkap, dengan nama kode Demeter, menandai iterasi pertama Arm pada inti seri-V berkinerja tinggi, serta transisi jajaran inti ini dari Armv8.4 ISA ke Armv9. Dan meskipun ini baru kali kedua Arm pada inti kinerja tinggi khusus untuk server, jangan salah: Arm bertujuan untuk menjadi ambisius. Perusahaan mengklaim bahwa CPU Neoverse V2 akan menawarkan kinerja integer single-threaded tertinggi yang tersedia di pasar, melampaui desain generasi berikutnya dari AMD dan Intel.

Meskipun pengumuman minggu ini dari Arm tidak sepenuhnya menyelami arsitektur baru – dan, yang lebih mengganggu, perusahaan tidak berbicara tentang metrik PPA tertentu – Arm menawarkan tampilan tingkat tinggi pada beberapa perubahan dan fitur yang akan datang dengan platform V2. Yang pasti, IP V2 sudah selesai dan dikirim ke pelanggan hari ini (terutama NVIDIA), tetapi Arm bermain malu-malu dengan apa yang mereka katakan tentang V2 sebelum chip pertama berdasarkan IP dikirimkan pada tahun 2023.

Pertama dan terpenting, bump ke Armv9 membawa serta rangkaian lengkap fitur yang datang dengan arsitektur Arm terbaru. Itu termasuk peningkatan keamanan yang merupakan fitur landasan arsitektur (dan terutama berguna untuk lingkungan bersama cloud) bersama dengan ekstensi vektor SVE2 Arm yang lebih baru.

Pada yang terakhir, Arm membuat perubahan yang menarik di sini dengan mengkonfigurasi ulang lebar mesin vektor mereka; sedangkan V1 mengimplementasikan SVE(1) menggunakan 2 pipeline 256-bit SIMD, V2 berpindah ke 4 pipa SIMD 128-bit. Hasil akhirnya adalah lebar SIMD kumulatif dari V2 tidak lebih lebar dari V1, tetapi alur eksekusi telah berubah untuk memproses sejumlah besar vektor yang lebih kecil secara paralel. Perubahan ini membuat lebar pipa SIMD identik dengan bagian Arm’s Cortex (yang semuanya 128-bit, ukuran minimum untuk SVE2), tetapi itu berarti Arm tidak lagi memanfaatkan sepenuhnya terukur bagian dari SVE dengan menggunakan SIMD yang lebih besar. Saya berharap kita akan mengetahui mengapa Arm mengambil rute ini setelah mereka melakukan penyelaman mendalam V2 penuh, karena saya ingin tahu apakah ini murni permainan efisiensi atau sesuatu yang lebih mirip dengan menyeragamkan desain di seluruh ekosistem Arm.

Setelah itu, mungkin perlu diperhatikan bahwa sementara slide presentasi Arm menempatkan bfloat16 dan int8 matmul sebagai fitur, ini bukan baru fitur. Namun, Arm menjanjikan bahwa pemrosesan SIMD V2 akan memberikan peningkatan efisiensi mikroarsitektur dibandingkan V1.

Secara lebih luas, V2 juga akan memperkenalkan ukuran cache L2 yang lebih besar. Desain V2 mendukung hingga 2MB cache L2 pribadi per inti, dua kali lipat ukuran maksimum V1. V2 juga akan memperkenalkan peningkatan lebih lanjut pada kinerja pemrosesan integer Arm, meskipun perusahaan tidak merinci lebih lanjut pada saat ini. Dari sudut pandang arsitektur, V1 meminjam sedikit dari desain CPU Cortex-X1, dan tidak akan terlalu mengejutkan jika itu sekali lagi terjadi pada V2, meminjam dari X2. Dalam hal ini, chip konsumen seperti Snapdragon 8 Gen1 dan Dimensity 9000 harus memberikan referensi longgar tentang apa yang diharapkan.

Untuk platform Demeter, Arm akan menggunakan kembali bahan mesh CMN-700, yang pertama kali diperkenalkan untuk generasi V1. CMN-700 masih merupakan desain mesh modern dengan dukungan hingga 144 node dalam konfigurasi 12×12, dan cocok untuk antarmuka dengan memori DDR5 serta PCIe 5/CXL 2 untuk I/O. Akibatnya, sebenarnya V2 tidak membawa sesuatu yang baru di tingkat fabric – bahkan 512MB SLC dapat dilakukan dengan pengaturan V1 + CMN-700 – tetapi ini berarti bahwa mesh CMN-700 dan fitur-fiturnya sekarang garis dasar bergerak maju dengan V2.

Inti Neoverse V2, pada gilirannya, akan menjadi landasan generasi mendatang dari CPU server Arm berkinerja tinggi. Unggulan de facto di sini adalah Grace CPU NVIDIA, yang akan menjadi salah satu desain V2 pertama (jika bukan yang pertama) yang dikirimkan pada tahun 2023. NVIDIA sebelumnya telah mengumumkan bahwa Grace akan didasarkan pada desain Neoverse, jadi pengumuman minggu ini dari Arm akhirnya mengkonfirmasi kecurigaan lama bahwa Grace akan didasarkan pada inti Neoverse V generasi berikutnya.

NVIDIA, pada bagiannya, memiliki acara GTC musim gugur yang dijadwalkan berlangsung hanya dalam beberapa hari. Jadi kemungkinan kita akan mendengar lebih banyak tentang Grace dan Neoverse V2-nya saat NVIDIA berusaha untuk mempromosikan chip tersebut sebelum rilis tahun depan.

Neoverse E2: Cortex-A510 Untuk Digunakan Dengan N2

Bersamaan dengan pengumuman Neoverse V2, Arm juga menggunakan pengarahan minggu ini untuk mengumumkan platform Neoverse E2. Berbeda dengan pengungkapan V2, ini adalah pengumuman skala yang jauh lebih kecil, dan Arm hanya menawarkan beberapa detail teknis. Pada akhirnya, hari E2 di bawah sinar matahari akan datang sedikit kemudian.

Konon, platform E2 sedang dikirimkan ke mitra dengan tujuan interoperabilitas dengan platform N2 yang ada. Untuk ini, Arm telah memasangkan CPU Cortex-A510, inti CPU Cortex kecil/efisiensi tinggi dari Arm, dan memasangkannya dengan mesh CMN-700. Ini dimaksudkan untuk memberikan fleksibilitas lebih lanjut kepada operator/vendor server dengan menyediakan inti CPU alternatif untuk N2, sambil tetap menawarkan fitur I/O dan memori modern dari Arm’s mesh. Menggarisbawahi hal ini, backplane sistem E2 bahkan kompatibel dengan backplane N2.

Neoverse Berikutnya: Poseidon, N-Next, dan E-Next

Akhirnya, pengumuman Arm minggu ini memberikan gambaran sekilas tentang peta jalan masa depan perusahaan untuk ketiga platform Neoverse, di mana, secara mengejutkan, Arm sedang mengerjakan versi terbaru dari masing-masing platform.

Khususnya, ketiga platform meminta untuk menambahkan dukungan PCIe 6 serta dukungan CXL 3.0. Ini akan datang dari iterasi berikutnya dari jaringan mesh CMN Arm, yang seperti yang sudah dilakukan Arm hari ini, dibagi di antara ketiga platform.

Sementara itu, menarik untuk melihat nama Poseidon sekali lagi muncul di peta jalan Arm. Kembali ke roadmap Neoverse pertama Arm, Poseidon adalah nama yang melekat pada platform 5mn/2021 Arm, tempat sejak diambil oleh N2 dan V1/V2 dalam berbagai bentuk. Dengan V2 tidak mendarat di perangkat keras hingga 2023, Poseidon/V3 masih bertahun-tahun, tetapi kemungkinan ada beberapa signifikansi untuk Arm menjaga nama kode (seperti mikroarsitektur baru).

Tapi yang pertama keluar dari gerbang adalah platform N-Next – kemungkinan Neoverse N3. Dengan platform Neoverse N satu generasi di depan yang lain (N2 pertama kali diumumkan pada tahun 2020), itu akan menjadi platform berikutnya karena penyegaran. N3 akan tersedia untuk mitra pada tahun 2023, dengan Arm secara luas menggembar-gemborkan peningkatan kinerja dan efisiensi generasi.

Perangkat Keras