NVIDIA Vera Rubin: Nền tảng AI 6 chip mạnh nhất 2026 ra mắt tại CES

MRTEK

Thứ Tư, 07/01/2026

NVIDIA vừa ra mắt Vera Rubin tại CES 2026 – nền tảng AI 6 chip mạnh mẽ nhất 2026, kế thừa Blackwell, tập trung vào AI factories quy mô lớn. Với Vera CPU 88 lõi, Rubin GPU 336 tỷ transistor, rack NVL72 siêu tốc và inference nhanh gấp 5 lần, chi phí token giảm 10 lần, Vera Rubin hứa hẹn thay đổi hoàn toàn cách huấn luyện và chạy AI thông minh. Sản xuất hàng loạt từ Q1 2026, sẵn sàng nửa cuối năm!

Tại CES 2026 (ngày 6/1/2026), NVIDIA đã chính thức giới thiệu Vera Rubin – nền tảng AI thế hệ tiếp theo sau Blackwell. Đây là một “siêu máy tính” được thiết kế hoàn toàn mới, gồm 6 chip kết hợp chặt chẽ với nhau, nhằm phục vụ các trung tâm dữ liệu AI quy mô cực lớn (gọi là AI factories). Tên gọi Vera Rubin được đặt theo nhà thiên văn học nổi tiếng – người đã chứng minh sự tồn tại của vật chất tối – như một cách NVIDIA tôn vinh những khám phá thay đổi thế giới.

Vera Rubin là gì và tại sao nó quan trọng?

Hãy tưởng tượng AI factories giống như một nhà máy khổng lồ sản xuất trí tuệ nhân tạo. Các công ty lớn như Google, Microsoft, Amazon cần hàng trăm nghìn chip để huấn luyện và chạy các mô hình AI phức tạp (như ChatGPT, trợ lý AI thông minh, hoặc AI tự suy luận). Vera Rubin được tạo ra để làm việc này nhanh hơn, tiết kiệm hơn và mạnh mẽ hơn rất nhiều so với thế hệ trước.

NVIDIA gọi đây là nền tảng “6 chip trong 1” – nghĩa là 6 thành phần được thiết kế cùng nhau từ đầu, giống như một cỗ máy khổng lồ hoạt động đồng bộ hoàn hảo.

6 chip chính trong Vera Rubin

Vera CPU: Bộ xử lý trung tâm với 88 lõi tùy chỉnh dựa trên công nghệ Arm. Nó giống như “bộ não” điều phối toàn bộ hệ thống, chuyên xử lý các tác vụ AI lớn.
Rubin GPU: “Trái tim” của nền tảng, chip đồ họa cực mạnh với 336 tỷ transistor (gấp nhiều lần chip thông thường). Nó giúp tính toán nhanh hơn, đặc biệt trong việc chạy AI suy luận (inference) – tức là khi AI trả lời câu hỏi hoặc tạo nội dung.
NVLink 6 Switch: “Hệ thống dây thần kinh” kết nối các chip với tốc độ cực nhanh (3.6 TB/s mỗi GPU), gấp đôi thế hệ trước.
ConnectX-9 SuperNIC và BlueField-4 DPU: Hai chip phụ trách mạng, lưu trữ dữ liệu và bảo mật, đảm bảo mọi thứ hoạt động trơn tru trong hệ thống khổng lồ.
Spectrum-X 102.4T CPO: Công tắc Ethernet siêu tốc, giúp kết nối hàng nghìn chip trong trung tâm dữ liệu mà không bị nghẽn.

Hệ thống rack-scale: Vera Rubin NVL72

NVIDIA giới thiệu Vera Rubin NVL72 – một rack (tủ máy) chứa:

72 GPU Rubin + 36 CPU Vera.
Tổng cộng 20.7 TB bộ nhớ HBM4 (siêu nhanh) và 54 TB LPDDR5x.
Băng thông kết nối nội bộ lên tới 260 TB/s (tốc độ truyền dữ liệu trong rack).

Nó giống như một “siêu máy tính mini” – có thể mở rộng thành các cụm lớn hơn (DGX SuperPOD) để huấn luyện AI quy mô hàng trăm nghìn chip.

Hiệu suất vượt trội như thế nào?

NVIDIA cho biết Vera Rubin mang lại những cải thiện rất lớn:

Huấn luyện mô hình AI phức tạp (MoE): Nhanh hơn Blackwell, chỉ cần 1/4 số GPU, chi phí giảm còn 1/7.
Chạy AI suy luận (inference): Nhanh hơn 5 lần, chi phí mỗi token (mỗi lần AI trả lời) thấp hơn 10 lần so với Blackwell.
Tiết kiệm năng lượng: Giảm đáng kể điện năng tiêu thụ, giúp các công ty lớn tiết kiệm hàng triệu đô la khi chạy AI quy mô lớn.

Ví dụ đơn giản: Nếu dùng Blackwell để huấn luyện một mô hình AI lớn mất 100 GPU, thì Vera Rubin chỉ cần khoảng 25 GPU mà vẫn nhanh hơn và rẻ hơn.

Thời gian triển khai

Đã bắt đầu sản xuất hàng loạt từ quý 1/2026.
Các sản phẩm thực tế (từ đối tác như AWS, Google Cloud, Microsoft Azure, Oracle, CoreWeave) sẽ có mặt vào nửa sau năm 2026.

Ý nghĩa lớn lao của Vera Rubin

Vera Rubin không chỉ là một con chip mới – nó là cách NVIDIA xây dựng tương lai của AI công nghiệp. Thay vì chỉ bán chip riêng lẻ, NVIDIA giờ bán cả “hệ thống hoàn chỉnh” (6 chip + rack + phần mềm), giúp các công ty lớn dễ dàng xây dựng trung tâm dữ liệu AI mạnh mẽ, nhanh chóng và tiết kiệm.

Đây là bước đi quan trọng để NVIDIA tiếp tục dẫn đầu trong cuộc đua AI, đặc biệt khi nhu cầu về AI thông minh (agentic AI – AI tự suy nghĩ, tự hành động) và mô hình lớn ngày càng tăng.