NVIDIA Umumkan Agentic AI, Vera CPU 88-Core di Computex 2026
Sorotan utama:
- Vera CPU dengan 88 core Olympus dan memori LPDDR5X 1,2 TB/s dirancang khusus untuk orkestrasi agen AI, bukan sekadar chatbot pasif.
- Platform Vera Rubin resmi rampung produksi untuk pabrik AI skala pod, menghubungkan CPU, GPU, dan jaringan fotonik dalam satu tumpukan terintegrasi.
- RTX Spark menggabungkan GPU Blackwell 6.144 CUDA core dengan CPU Grace 20-core dan memori terpadu 128 GB untuk PC Windows AI lokal bersama Microsoft.
- Pergeseran fokus NVIDIA dari model generatif ke agen otonom yang menulis kode, memanggil API (Application Programming Interface), dan mengambil keputusan tanpa intervensi manusia.
Artikel ini ditulis berdasarkan analisis dokumentasi teknis NVIDIA Newsroom dan konfirmasi resmi Jensen Huang pada keynote Computex 2026.
Taipei menjadi panggung perubahan arsitektur komputasi ketika Jensen Huang, pendiri dan CEO NVIDIA, membuka keynote Computex 2026 pada 1 Juni dengan kalimat singkat yang menentukan arah industri: “Agentic AI has arrived.” Pernyataan itu bukan sekadar slogan. Ia disertai tiga pengumuman perangkat keras yang saling mengunci: CPU Vera yang disebut sebagai prosesor pertama yang dibuat untuk agen, platform Vera Rubin yang dinyatakan masuk produksi penuh, dan superchip RTX Spark untuk PC Windows yang dikembangkan bersama Microsoft.
Mengapa ini penting sekarang. Selama tiga tahun terakhir, AI belajar menghasilkan teks dan gambar, lalu belajar bernalar. Tahap berikutnya, menurut Huang, adalah AI yang melakukan pekerjaan berguna. Vera menyediakan otak orkestrasi di pusat data, Vera Rubin menyediakan pabriknya, dan RTX Spark membawa agen itu turun ke meja kerja.
Apa itu Agentic AI dan mengapa NVIDIA menyebutnya tiba?
Agentic AI adalah sistem yang tidak hanya menjawab pertanyaan, tetapi merencanakan tugas, menjalankan alat, mengakses data, menulis kode, dan memvalidasi hasilnya secara mandiri. NVIDIA menyebut era ini tiba karena infrastruktur pendukungnya kini siap diproduksi massal, bukan prototipe lab.
Di atas panggung GTC Taipei, Huang menjelaskan pergeseran beban kerja. Jika chatbot generatif didominasi inferensi satu arah, agen membutuhkan ribuan panggilan API, koordinasi antar-agen, dan latensi rendah yang konsisten. CPU tradisional yang dirancang untuk manusia yang menyewa core sesekali tidak cocok. “Humans rent cores… but agents, they want to use the CPU to get the job done,” ujarnya dalam forum analis, menggambarkan agen yang hidup terus-menerus di mesin. Narasi ini menandai perubahan dari model sebagai layanan menjadi agen sebagai pekerja digital.
NVIDIA merespons dengan membangun tumpukan penuh. Di sisi perangkat lunak, mereka mengumumkan NVIDIA Agent Toolkit, NemoClaw, dan OpenShell untuk Windows. Di sisi perangkat keras, Vera dan RTX Spark menjadi fondasi. Menurut siaran resmi, Vera adalah prosesor pertama di dunia yang dibuat khusus untuk era agentic AI dan reinforcement learning, dengan efisiensi dua kali lipat dan 50 persen lebih cepat dibanding CPU tradisional skala rak.
Bagaimana arsitektur Vera CPU 88-core berbeda dari CPU tradisional?
Vera CPU berbeda pada tiga titik: inti, memori, dan interkoneksi. Ia memakai 88 core kustom rancangan NVIDIA bernama Olympus, bukan core Arm Cortex generik. Setiap core dapat menjalankan dua tugas sekaligus lewat Spatial Multithreading, sehingga total 176 thread logis tersedia untuk orkestrasi agen yang padat.
Memori menjadi pembeda kedua. Vera meninggalkan DDR tradisional dan beralih ke LPDDR5X (Low Power Double Data Rate 5X), subsistem memori daya rendah generasi kedua NVIDIA, yang memberikan bandwidth hingga 1,2 TB/s. Angka ini diklaim dua kali lipat bandwidth CPU tujuan umum dengan separuh daya. Untuk agen yang terus memanggil basis data vektor dan konteks percakapan, bandwidth per core yang tinggi mengurangi antrean.
Pembeda ketiga adalah NVLink-C2C (Chip-to-Chip) generasi kedua. Vera terhubung ke GPU lewat interkoneksi koheren 1,8 TB/s, yang disebut 7 kali lipat bandwidth PCIe Gen 6. Koherensi memungkinkan CPU dan GPU berbagi ruang alamat tanpa salin data berulang, krusial untuk agen yang bergantian antara logika simbolik di CPU dan inferensi di GPU.
Hasilnya terasa pada skala. NVIDIA mengumumkan rak Vera berisi 256 CPU berpendingin cairan yang mampu menopang lebih dari 22.500 lingkungan CPU konkuren, masing-masing berjalan independen pada performa penuh. Angka itu bukan untuk benchmark sintetis, melainkan untuk skenario pabrik AI tempat ribuan agen coding, agen pengujian, dan agen orkestrasi hidup berdampingan. Mitra awal yang sudah menguji meliputi Alibaba Cloud, ByteDance, Meta, dan Oracle Cloud Infrastructure, sementara manufaktur diadopsi Dell Technologies, HPE, Lenovo, dan Supermicro.
Apa peran platform Vera Rubin dalam pabrik AI?
Vera Rubin bukan sekadar GPU baru. Ia adalah platform enam komponen yang menggabungkan Rubin GPU, Vera CPU, NVLink 6, ConnectX-9, BlueField-4 DPU (Data Processing Unit), dan Spectrum-X Ethernet Photonics menjadi satu sistem skala pod. Pada 31 Mei 2026 di Taipei, NVIDIA menyatakan platform ini ramping ke produksi penuh untuk menggerakkan pabrik AI di seluruh dunia.
Huang menyebut Vera Rubin lebih dari GPU, melainkan sistem multi-rak yang dibangun khusus untuk beban kerja agentic AI. Dalam dokumen teknis, Rubin GPU dipasangkan dengan Vera lewat NVLink-C2C sehingga memori LPDDR5X CPU dan HBM4 GPU dapat berfungsi sebagai kumpulan memori terpadu. Konfigurasi ini menghilangkan hambatan klasik antara penyimpanan data dan komputasi model.
Produksi penuh memiliki arti ekonomi. Huang menegaskan, “Compute is revenues. Compute is profit,” menekankan bahwa performa per watt, keandalan, dan kecepatan penyebaran menjadi metrik utama operator infrastruktur AI. Dengan Vera Rubin, NVIDIA mengklaim pengurangan biaya token inferensi hingga 10 kali dan kebutuhan GPU yang lebih sedikit untuk model fondasi dibanding generasi Blackwell. Pelanggan awal yang disebut dalam presentasi termasuk Anthropic, OpenAI, dan xAI milik SpaceX, dengan sistem pertama dijadwalkan kirim pada musim gugur.
Mengapa RTX Spark bersama Microsoft mengubah PC Windows?
RTX Spark adalah jawaban NVIDIA untuk kritik lama bahwa AI canggih hanya hidup di cloud. Diumumkan di Computex 2026, chip ini dirancang ulang untuk era agen personal di Windows. Ia memadukan GPU Blackwell RTX dengan 6.144 CUDA core dan Tensor Core generasi kelima presisi FP4 (Floating Point 4-bit), terhubung via NVLink-C2C ke CPU Grace 20-core berperforma tinggi.
Spesifikasi kuncinya adalah memori terpadu 128 GB dan komputasi AI hingga 1 petaflop. Kombinasi ini memungkinkan model bahasa besar berjalan lokal tanpa mengirim data sensitif ke luar perangkat. NVIDIA dan Microsoft bermitra untuk menghadirkan primitif keamanan OS baru dan runtime OpenShell, sehingga agen dapat berjalan aman di Windows dengan isolasi yang lebih kuat.
Dampaknya langsung ke bentuk perangkat. Laptop RTX Spark dirancang setipis 14 milimeter dan seringan 3 pon, dengan sasis aluminium dan layar tandem OLED yang mendukung G-SYNC. Desktop ringkas menyasar kreator dan pengembang. Menurut NVIDIA, perangkat akan tersedia musim gugur ini dari ASUS, Dell, HP, Lenovo, Microsoft Surface, dan MSI, disusul Acer dan GIGABYTE.
Microsoft tidak sekadar menjadi OEM. Di Build 2026, Satya Nadella memperkenalkan Surface RTX Spark Dev Box sebagai “dream machine” untuk pengembang agen lokal. Adobe pun menyatakan akan merombak Photoshop dan Premiere untuk akselerasi penuh di RTX Spark, menjanjikan performa AI dan grafis dua kali lebih cepat. Pergeseran ini mengembalikan PC dari alat yang menunggu perintah menjadi rekan kerja yang proaktif.
Bagaimana regulasi Indonesia membaca agen yang berjalan lokal?
Di Indonesia, pergeseran ke agen otonom lokal menyentuh dua payung hukum utama: UU PDP (Undang-Undang Pelindungan Data Pribadi) dan UU ITE (Undang-Undang Informasi dan Transaksi Elektronik). UU PDP mewajibkan dasar pemrosesan yang sah, minimisasi data, dan keamanan yang sesuai risiko. Agen yang berjalan di RTX Spark dan memproses dokumen pribadi di perangkat mengurangi transfer lintas batas, namun tidak menghapus kewajiban pengendali data untuk mencatat aktivitas pemrosesan dan memastikan persetujuan.
UU ITE, khususnya ketentuan tentang intersepsi dan akses tanpa hak, menjadi relevan ketika agen memanggil API pihak ketiga atau mengeksekusi kode. Jika agen secara otomatis mengunduh data dari layanan cloud atau menulis ke basis data perusahaan, organisasi harus memastikan log audit, kontrol identitas, dan mekanisme penghentian darurat. NVIDIA menyebut OpenShell dan BlueField-4 DPU sebagai lapisan keamanan untuk agen lokal, namun hingga tenggat publikasi, dokumentasi rinci tentang integrasi OpenShell dengan primitif keamanan Windows di lingkungan multi-tenant Indonesia belum dipublikasikan secara terbuka.
Implikasi infrastruktur juga nyata. Rak Vera dengan 256 CPU dan ribuan lingkungan konkuren menuntut daya dan pendinginan yang jauh melampaui pusat data tier 2 konvensional. Di Jakarta dan Surabaya, operator yang ingin menggelar pabrik AI skala pod perlu menyiapkan arsitektur 800 VDC dan rak berpendingin cairan. Flex telah memamerkan power shelf 110 kW untuk platform Vera Rubin NVL72 di Computex, sinyal bahwa rantai pasok daya sedang mengejar kepadatan komputasi baru.
Di mana celah informasi yang belum dibuka NVIDIA?
Meski spesifikasi inti sudah diumumkan, beberapa rincian arsitektur masih ditutup. NVIDIA belum merilis whitepaper lengkap tentang Spatial Multithreading pada core Olympus, termasuk bagaimana penjadwalan menjamin performa deterministik saat 22.500 agen berbagi cache. Angka 1,2 TB/s untuk LPDDR5X telah dikonfirmasi, namun konfigurasi kanal memori dan latensi efektif pada beban kerja reinforcement learning masih berstatus belum dipublikasikan secara terbuka.
Di sisi perangkat lunak, NVIDIA menyebut peningkatan 2 kali lipat pada llama.cpp dan 2,6 kali pada vLLM untuk model agen, tetapi belum merinci patch kernel atau versi driver yang diperlukan. Untuk RTX Spark, dukungan Prism emulator Microsoft untuk aplikasi Win32 lama disebut telah disetel, namun daftar kompatibilitas resmi per aplikasi kreatif Indonesia belum tersedia.
Harga juga menjadi tanda tanya. NVIDIA menyatakan Vera dalam produksi penuh dan tersedia dari mitra pada paruh kedua tahun ini, tetapi tidak menyebut MSRP (Manufacturer Suggested Retail Price) untuk konfigurasi single-socket maupun dual-socket. Di pasar Asia Tenggara, total biaya kepemilikan akan sangat dipengaruhi tarif impor, ketersediaan HBM4 dari Samsung, SK Hynix, dan Micron, serta biaya listrik pusat data.
Apa dampaknya bagi pengembang dan perusahaan di Asia?
Bagi pengembang, pesan utamanya adalah lokalisasi agen. Dengan 128 GB memori terpadu di RTX Spark, model dengan puluhan miliar parameter dapat berjalan di laptop tanpa antrean cloud. Ini membuka skenario baru untuk studio game di Bandung, firma hukum di Jakarta, atau rumah sakit yang ingin menjalankan agen triase tanpa mengirim rekam medis keluar. Cursor, startup alat coding berbasis AI, sudah mengadopsi Vera untuk meningkatkan throughput agen coding mereka, sementara Redpanda melaporkan latensi 5,5 kali lebih rendah pada beban kerja Kafka di atas Vera.
Bagi perusahaan, Vera Rubin mengubah cara membeli infrastruktur. Alih-alih membeli CPU dan GPU terpisah, mereka membeli pod yang sudah terintegrasi jaringan fotonik dan DPU keamanan. HPE memperkenalkan ProLiant Compute DL394 Gen12 berbasis Vera di Computex, menargetkan orkestrasi agen di sektor keuangan termasuk eksplorasi oleh NYSE. Laboratorium nasional seperti Leibniz Supercomputing Centre dan TACC juga menyiapkan node Vera untuk beban ilmiah, indikasi bahwa arsitektur ini tidak eksklusif untuk hyperscaler.
Namun transisi ini menuntut keterampilan baru. Tim IT harus memahami orkestrasi agen, observabilitas rantai panggilan alat, dan kebijakan keamanan untuk agen yang dapat menulis kode. Di Indonesia, di mana talenta MLOps masih terkonsentrasi di kota besar, kesenjangan keterampilan bisa menjadi penghambat adopsi lebih cepat daripada harga perangkat keras.
Masa Depan
Computex 2026 menandai titik balik yang jarang terjadi: CPU kembali menjadi bintang setelah satu dekade didominasi GPU. Dengan Vera, NVIDIA tidak sekadar menambah core, ia mendefinisikan ulang apa yang harus dilakukan core ketika pekerja utamanya bukan manusia melainkan agen. Vera Rubin menyediakan pabriknya, RTX Spark menyediakan kantor cabangnya di setiap meja.
Dalam 12 hingga 18 bulan ke depan, pantau tiga hal. Pertama, ketersediaan perangkat lunak agen yang benar-benar aman untuk Windows di lingkungan perusahaan Indonesia, termasuk audit OpenShell terhadap UU PDP. Kedua, ekonomi token lokal: apakah menjalankan model 70 miliar parameter di laptop dengan FP4 benar-benar lebih murah daripada inferensi cloud setelah menghitung listrik dan depresiasi. Ketiga, respons ekosistem: Intel, AMD, dan Qualcomm tidak akan diam, dan persaingan di segmen PC AI lokal akan menentukan standar terbuka untuk interkoneksi CPU-GPU di luar NVLink.
Jika visi Huang terwujud, komputer tidak lagi dibuka untuk menjalankan aplikasi. Komputer akan dinyalakan untuk bekerja, sementara manusia memberi tujuan. Pergeseran itu mengubah desain pusat data, desain laptop, bahkan desain pekerjaan. Bagi Indonesia, ini peluang untuk membangun kedaulatan data lewat agen lokal, sekaligus ujian bagi regulasi, talenta, dan infrastruktur energi kita.
