Huang Renxun CES định hướng 2026: Vera Rubin toàn diện sản xuất hàng loạt, ô tô tự lái AI ra mắt Q1, quy trình sản xuất quan trọng đến từ TSMC

2026-01-06 04:13:54

Trong khuôn khổ triển lãm CES 2026, CEO của NVIDIA (黄仁勳) đã hiếm hoi không đề cập nhiều đến dòng sản phẩm card đồ họa GeForce, mà thay vào đó tập trung toàn diện vào trung tâm dữ liệu, xe tự lái, robot và các mô hình mở.

Trong bài phát biểu này,黄仁勳 đã công bố hợp tác giữa NVIDIA và Mercedes-Benz, mẫu xe tự lái AI đầu tiên đã chính thức sản xuất hàng loạt, được chứng nhận an toàn nhất của NCAP, Mercedes-Benz CLA trang bị mô hình ô tô của NVIDIA Alpamayo. Dự kiến ra mắt tại thị trường Mỹ trong Quý 1, vào châu Âu trong Quý 2, nhanh nhất là trong Quý 3 năm nay sẽ ra mắt tại châu Á.

Vera Rubin đang được mong đợi cũng đã bắt đầu sản xuất hàng loạt toàn diện, đây là sản phẩm chủ lực của NVIDIA sau Blackwell, không chỉ là một chip đơn lẻ mà còn là tên gọi của nền tảng AI thế hệ tiếp theo. Một Rubin Pod đơn gồm 16 tủ rack, tổng cộng 1.152 GPU, mỗi tủ rack chứa 72 Rubin, và mỗi Rubin thực chất là sự hợp nhất của hai chip GPU. So với Grace CPU và Blackwell GPU, thế hệ mới Vera CPU có hiệu năng đơn luồng, dung lượng bộ nhớ và chỉ số tính toán tổng thể đều được nâng cao rõ rệt.

Cũng xuất hiện trong lần này là bộ xử lý thế hệ mới dành riêng cho trung tâm dữ liệu, BlueField-4, có khả năng phân chia các trung tâm dữ liệu siêu lớn thành nhiều khối độc lập, phục vụ các người dùng khác nhau cùng hoạt động. Ngoài ra còn có nền tảng chuyển mạch mạng trung tâm AI thế hệ mới Spectrum-X Ethernet Co-Packaged Optics (CPO), công nghệ then chốt phía sau đến từ quá trình phát triển chung của TSMC và NVIDIA, mang tên COOP (tích hợp quang tử silicon).

Về mặt mô hình,黄仁勳 nhấn mạnh rằng mở là chìa khóa của hệ sinh thái AI. Hiện tại, NVIDIA đã ra mắt bộ mô hình hoàn toàn mở trong sáu lĩnh vực chính, bao gồm Clara (y tế), Earth-2 (khí hậu), Nemotron (suy luận và đa mô thức), Cosmos (robot và mô phỏng), GR00T (trí thông minh thể chất), cùng với mô hình xe tự lái Alpamayo.

NVIDIA ra mắt xe tự lái AI đầu tiên trong Quý 1

Tại CES 2026,黄仁勳 đã đề cập đầu tiên đến Alpamayo, định vị là mô hình thị giác-ngôn ngữ-hành động (VLA) mở đầu tiên trên thế giới có khả năng suy luận. Alpamayo được huấn luyện từ đầu đến cuối, kết nối trực tiếp từ cảm biến đầu vào đến các đầu ra điều hướng, phanh và tăng tốc, dữ liệu huấn luyện kết hợp nhiều ví dụ lái xe thực tế của con người, dữ liệu tổng hợp do Cosmos tạo ra, cùng hàng trăm nghìn mẫu dữ liệu được chú thích chi tiết. Khác với hệ thống truyền thống, Alpamayo không chỉ thực hiện hành động mà còn có khả năng giải thích ngay lập tức lý do tại sao lại chọn hành động đó.

黄仁勳 tuyên bố rằng, chiếc xe tự lái đầu tiên của NVIDIA sẽ ra mắt trong Quý 1 năm nay. Dự kiến ra mắt tại Mỹ trong Quý 1, châu Âu trong Quý 2, nhanh nhất là trong Quý 3 đến Quý 4 sẽ ra mắt tại châu Á.

Về kiến trúc, mô hình chính là Alpamayo, còn về ứng dụng, chính là Mercedes-Benz CLA. Mẫu Mercedes-Benz CLA này vừa qua đã được chứng nhận và chính thức sản xuất hàng loạt. Nó cũng đã đạt tiêu chuẩn đánh giá NCAP, được xếp hạng là xe an toàn nhất thế giới. Chiếc xe tự lái này có hai chế độ: một là hệ thống tự lái AI có khả năng suy luận, chế độ còn lại là hệ thống tự lái truyền thống theo quy tắc, hoàn toàn có thể truy xuất nguồn gốc. Các chính sách an toàn và mô-đun đánh giá tích hợp sẽ liên tục đánh giá xem AI có tiếp quản hay không, hoặc chuyển về hệ thống truyền thống cẩn trọng hơn.

黄仁勳 công bố Vera Rubin đã chính thức đi vào sản xuất hàng loạt toàn diện, phân tích chi tiết

Một trong những nội dung chính của bài phát biểu là NVIDIA chính thức công bố nền tảng Rubin đã bước vào sản xuất hàng loạt toàn diện. Rubin được định vị là thế hệ kế tiếp của Blackwell, đồng thời là nền tảng AI gồm sáu chip do NVIDIA thiết kế theo phương pháp hợp tác tối đa, bắt đầu từ trung tâm dữ liệu, tích hợp tính toán, mạng lưới, lưu trữ và phần mềm.

Trong hệ sinh thái của NVIDIA, Vera Rubin không phải là một chip đơn lẻ mà là tên gọi của nền tảng AI thế hệ tiếp theo: trung tâm là kết hợp Vera CPU và Rubin GPU qua NVLink‑C2C thành siêu chip Vera Rubin, rồi xếp chồng thành hệ thống siêu máy tính AI Vera Rubin NVL72, dùng để chạy AI agentic, suy luận dài hạn và các tải công việc của nhà máy AI.

Một Rubin Pod đơn gồm 16 tủ rack, tổng cộng 1.152 GPU, mỗi tủ rack chứa 72 Rubin, và mỗi Rubin thực chất là sự hợp nhất của hai chip GPU. Vera CPU đi kèm được thiết kế đặc biệt cho siêu máy tính, trong điều kiện giới hạn công suất, hiệu năng đạt gấp đôi so với CPU hàng đầu hiện nay, đồng thời có tốc độ truyền dữ liệu cực cao.

So với các thế hệ trước như Grace CPU và Blackwell GPU, Vera CPU thế hệ mới có hiệu năng đơn luồng, dung lượng bộ nhớ và chỉ số tính toán tổng thể đều được nâng cao rõ rệt, sau khi kết nối trực tiếp với Rubin GPU, tạo thành một trung tâm tính toán AI khổng lồ, như một chiến hạm khổng lồ.

Nền tảng Rubin bao gồm Rubin GPU, Vera CPU, NVLink 6, Spectrum-X Ethernet Co-Packaged Optics (CPO), ConnectX-9 SuperNIC và BlueField-4 DPU. Trong đó, Rubin GPU đạt hiệu năng suy luận 50 petaflops dưới độ chính xác NVFP4.黄仁勳 thẳng thắn nói rằng, thông qua thiết kế tích hợp toàn bộ tủ rack và mạng lưới, mục tiêu của Rubin là loại bỏ mọi điểm nghẽn, giảm tổng chi phí sở hữu (TCO) của mỗi token AI xuống khoảng một phần mười so với trước đây.

Nền tảng xử lý trung tâm dữ liệu thế hệ mới BlueField-4

Về phần phần cứng, NVIDIA cũng lần đầu công bố chi tiết triển khai thực tế của Vera CPU và BlueField-4. Vera CPU được thiết kế dựa trên các tình huống giới hạn công suất, hiệu năng trên mỗi watt đạt gấp đôi CPU hàng đầu hiện nay, đồng thời nâng cao rõ rệt hiệu năng đơn luồng và dung lượng bộ nhớ, phù hợp để xây dựng siêu máy tính AI và trung tâm dữ liệu.

黄仁勳 giới thiệu thêm về bộ xử lý trung tâm dữ liệu mới của NVIDIA, BlueField-4, có khả năng phân chia trung tâm dữ liệu siêu lớn thành nhiều khối độc lập, phục vụ nhiều người dùng cùng lúc, đồng thời chuyển tải các công việc lớn như ảo hóa, an ninh mạng và quản lý lưu lượng mạng miền Nam-Bắc từ CPU, biến nó thành trang bị tiêu chuẩn cho từng nút tính toán. Ông cũng tuyên bố NVIDIA sẽ thúc đẩy tiêu chuẩn hệ thống kiến trúc ngành, để toàn bộ hệ sinh thái và chuỗi cung ứng dùng chung các thành phần.

Vì một hệ thống MGX gồm khoảng 80.000 linh kiện, nếu thay đổi thông số kỹ thuật hàng năm sẽ gây ra lãng phí lớn, nên các nhà sản xuất chính như Foxconn, Quanta, Wistron, cùng các hãng lớn như HP, Dell, Lenovo đều có thể trực tiếp đưa nền tảng mới vào hệ thống sản xuất hiện có.

Điều đáng chú ý là, mặc dù Vera Rubin tiêu thụ năng lượng gấp đôi thế hệ trước là Grace Blackwell, nhưng luồng khí vào gần như không thay đổi, nhiệt độ nước làm mát vẫn duy trì ở 45°C, trung tâm dữ liệu thậm chí không cần lắp đặt máy làm lạnh nước, giống như làm mát siêu máy tính bằng nước nóng.

Nền tảng chuyển mạch CPO trung tâm dữ liệu, công nghệ then chốt đến từ quy trình COOP của TSMC

Nền tảng chuyển mạch mạng trung tâm dữ liệu AI thế hệ mới Spectrum-X Ethernet Co-Packaged Optics (CPO), công nghệ then chốt đến từ quá trình phát triển chung của TSMC và NVIDIA, mang tên COOP (tích hợp quang tử silicon).

Quy trình này tích hợp các thành phần quang tử silicon trực tiếp vào trong gói đóng của chip chuyển mạch, thay vì sử dụng các module quang ngoài như truyền thống, giúp mỗi chip chuyển mạch có thể hỗ trợ băng thông mở rộng lên tới 102.4 Tb/s, đồng thời cung cấp khả năng kết nối tốc độ cao tối đa 512 cổng, mỗi cổng 200Gb/s.

Bài viết này, Huang Renxun CES định hướng 2026: Vera Rubin sản xuất hàng loạt toàn diện, xe tự lái AI Quý 1 ra mắt, công nghệ then chốt đến từ TSMC, xuất hiện lần đầu trên các trang tin ABMedia.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.