NVIDIA đang nỗ lực xây dựng nền tảng mặc định trong lĩnh vực robot, nhằm mục tiêu sao chép vị thế thống trị của Android trong hệ điều hành điện thoại thông minh.
Vào ngày 5 tháng 1, tại CES 2026, NVIDIA đã giới thiệu nhiều mô hình cơ bản mã nguồn mở, bao gồm nhiều mô hình cơ bản mã nguồn mở giúp robot có thể lý luận, lập kế hoạch và thích nghi trong nhiều nhiệm vụ và môi trường khác nhau, tất cả đều mở trên nền tảng Hugging Face.
NVIDIA cũng ra mắt thế hệ mới của kiến trúc Blackwell cùng card đồ họa Jetson T4000, và một trung tâm chỉ huy mã nguồn mở mang tên OSMO để hỗ trợ toàn bộ quy trình phát triển robot. Công ty còn mở rộng hợp tác với Hugging Face nhằm giảm thiểu rào cản phần cứng và kỹ thuật trong huấn luyện robot.
Chiến lược này phản ánh xu hướng ngành công nghiệp chuyển dịch trí tuệ nhân tạo từ đám mây sang thế giới vật lý. Khi chi phí cảm biến giảm, công nghệ mô phỏng tiến bộ và khả năng tổng quát của mô hình AI tăng lên, robot đang tiến tới hướng phát triển đa năng thay vì chỉ thực hiện nhiệm vụ đơn lẻ. Các doanh nghiệp như Boston Dynamics, Caterpillar đã bắt đầu sử dụng công nghệ của NVIDIA, và lĩnh vực robot cũng trở thành lĩnh vực phát triển nhanh nhất trên nền tảng Hugging Face.
Xây dựng ma trận mô hình hoàn chỉnh
Các mô hình cơ bản mà NVIDIA giới thiệu lần này tạo thành lớp năng lực cốt lõi của AI vật lý.
Cosmos Transfer 2.5 và Cosmos Predict 2.5 là các mô hình thế giới chịu trách nhiệm tạo dữ liệu tổng hợp và đánh giá chiến lược robot, có thể xác nhận hành vi robot trong môi trường mô phỏng.
Cosmos Reason 2 là mô hình ngôn ngữ thị giác dựa trên lý luận, giúp hệ thống AI có khả năng quan sát, hiểu và hành động trong thế giới vật lý.
Isaac GR00T N1.6 là mô hình hành động ngôn ngữ thị giác dành riêng cho phát triển robot hình người, dựa trên Cosmos Reason làm trung tâm lý luận, thực hiện kiểm soát toàn thân, cho phép robot hình người vừa di chuyển vừa thao tác vật thể.
Tại CES, NVIDIA giới thiệu Isaac Lab-Arena, một khung mô phỏng mã nguồn mở được lưu trữ trên GitHub, nhằm giải quyết các điểm đau trong xác nhận khả năng của robot.
Khi robot học các nhiệm vụ phức tạp như xử lý vật thể chính xác, lắp đặt cáp, việc xác nhận các khả năng này trong môi trường vật lý thường tốn kém, mất thời gian và có rủi ro.
Nền tảng này tích hợp nguồn lực, kịch bản nhiệm vụ, công cụ huấn luyện cùng các chuẩn đánh giá như Libero, RoboCasa và RoboTwin, xây dựng khung chung cho ngành chưa có tiêu chuẩn thống nhất trước đó. Nền tảng mã nguồn mở OSMO như trung tâm chỉ huy sẽ tích hợp toàn bộ quy trình từ tạo dữ liệu đến huấn luyện, hỗ trợ môi trường trên bàn làm việc và đám mây.
Giảm rào cản phần cứng
Thành viên mới trong dòng Jetson T4000, card đồ họa Jetson T4000 trang bị kiến trúc Blackwell, là giải pháp nâng cấp hiệu năng tính toán tại chỗ với chi phí hợp lý, cung cấp 1200 nghìn tỷ phép tính AI floating point và 64GB bộ nhớ, tiêu thụ năng lượng từ 40 đến 70 watt.
NVIDIA còn mở rộng hợp tác với Hugging Face, tích hợp công nghệ Isaac và GR00T vào khung LeRobot của họ, kết nối 2 triệu nhà phát triển robot của NVIDIA với 13 triệu nhà xây dựng AI của Hugging Face.
Robot hình người mã nguồn mở Reachy 2 hiện đã hỗ trợ trực tiếp chip NVIDIA Jetson Thor, cho phép nhà phát triển thử nghiệm các mô hình AI khác nhau mà không bị khóa trong hệ thống độc quyền.
Dấu hiệu ban đầu cho thấy chiến lược của NVIDIA đang phát huy hiệu quả. Robot đã trở thành lĩnh vực phát triển nhanh nhất trên nền tảng Hugging Face, các mô hình của NVIDIA dẫn đầu về số lượt tải xuống. Các doanh nghiệp như Boston Dynamics, Caterpillar, Franka Robots và NEURA Robotics đã bắt đầu sử dụng công nghệ của NVIDIA.
Chiến lược này thể hiện ý đồ của công ty trong việc làm cho phát triển robot dễ tiếp cận hơn, đồng thời định vị mình như nhà cung cấp phần cứng và phần mềm nền tảng, tương tự vai trò của Android đối với các nhà sản xuất điện thoại thông minh.
Khi AI chuyển dịch từ đám mây sang các máy móc có khả năng học hỏi trong thế giới vật lý, các cảm biến rẻ hơn, công nghệ mô phỏng tiên tiến và các mô hình AI có khả năng tổng quát đa nhiệm đang thúc đẩy toàn bộ ngành chuyển đổi.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
NVIDIA muốn làm "Android" của "AI vật lý"
Viết bài: Bào Y Long
Nguồn: Wallstreet Jingwen
NVIDIA đang nỗ lực xây dựng nền tảng mặc định trong lĩnh vực robot, nhằm mục tiêu sao chép vị thế thống trị của Android trong hệ điều hành điện thoại thông minh.
Vào ngày 5 tháng 1, tại CES 2026, NVIDIA đã giới thiệu nhiều mô hình cơ bản mã nguồn mở, bao gồm nhiều mô hình cơ bản mã nguồn mở giúp robot có thể lý luận, lập kế hoạch và thích nghi trong nhiều nhiệm vụ và môi trường khác nhau, tất cả đều mở trên nền tảng Hugging Face.
NVIDIA cũng ra mắt thế hệ mới của kiến trúc Blackwell cùng card đồ họa Jetson T4000, và một trung tâm chỉ huy mã nguồn mở mang tên OSMO để hỗ trợ toàn bộ quy trình phát triển robot. Công ty còn mở rộng hợp tác với Hugging Face nhằm giảm thiểu rào cản phần cứng và kỹ thuật trong huấn luyện robot.
Chiến lược này phản ánh xu hướng ngành công nghiệp chuyển dịch trí tuệ nhân tạo từ đám mây sang thế giới vật lý. Khi chi phí cảm biến giảm, công nghệ mô phỏng tiến bộ và khả năng tổng quát của mô hình AI tăng lên, robot đang tiến tới hướng phát triển đa năng thay vì chỉ thực hiện nhiệm vụ đơn lẻ. Các doanh nghiệp như Boston Dynamics, Caterpillar đã bắt đầu sử dụng công nghệ của NVIDIA, và lĩnh vực robot cũng trở thành lĩnh vực phát triển nhanh nhất trên nền tảng Hugging Face.
Xây dựng ma trận mô hình hoàn chỉnh
Các mô hình cơ bản mà NVIDIA giới thiệu lần này tạo thành lớp năng lực cốt lõi của AI vật lý.
Cosmos Transfer 2.5 và Cosmos Predict 2.5 là các mô hình thế giới chịu trách nhiệm tạo dữ liệu tổng hợp và đánh giá chiến lược robot, có thể xác nhận hành vi robot trong môi trường mô phỏng.
Cosmos Reason 2 là mô hình ngôn ngữ thị giác dựa trên lý luận, giúp hệ thống AI có khả năng quan sát, hiểu và hành động trong thế giới vật lý.
Isaac GR00T N1.6 là mô hình hành động ngôn ngữ thị giác dành riêng cho phát triển robot hình người, dựa trên Cosmos Reason làm trung tâm lý luận, thực hiện kiểm soát toàn thân, cho phép robot hình người vừa di chuyển vừa thao tác vật thể.
Tại CES, NVIDIA giới thiệu Isaac Lab-Arena, một khung mô phỏng mã nguồn mở được lưu trữ trên GitHub, nhằm giải quyết các điểm đau trong xác nhận khả năng của robot.
Khi robot học các nhiệm vụ phức tạp như xử lý vật thể chính xác, lắp đặt cáp, việc xác nhận các khả năng này trong môi trường vật lý thường tốn kém, mất thời gian và có rủi ro.
Nền tảng này tích hợp nguồn lực, kịch bản nhiệm vụ, công cụ huấn luyện cùng các chuẩn đánh giá như Libero, RoboCasa và RoboTwin, xây dựng khung chung cho ngành chưa có tiêu chuẩn thống nhất trước đó. Nền tảng mã nguồn mở OSMO như trung tâm chỉ huy sẽ tích hợp toàn bộ quy trình từ tạo dữ liệu đến huấn luyện, hỗ trợ môi trường trên bàn làm việc và đám mây.
Giảm rào cản phần cứng
Thành viên mới trong dòng Jetson T4000, card đồ họa Jetson T4000 trang bị kiến trúc Blackwell, là giải pháp nâng cấp hiệu năng tính toán tại chỗ với chi phí hợp lý, cung cấp 1200 nghìn tỷ phép tính AI floating point và 64GB bộ nhớ, tiêu thụ năng lượng từ 40 đến 70 watt.
NVIDIA còn mở rộng hợp tác với Hugging Face, tích hợp công nghệ Isaac và GR00T vào khung LeRobot của họ, kết nối 2 triệu nhà phát triển robot của NVIDIA với 13 triệu nhà xây dựng AI của Hugging Face.
Robot hình người mã nguồn mở Reachy 2 hiện đã hỗ trợ trực tiếp chip NVIDIA Jetson Thor, cho phép nhà phát triển thử nghiệm các mô hình AI khác nhau mà không bị khóa trong hệ thống độc quyền.
Dấu hiệu ban đầu cho thấy chiến lược của NVIDIA đang phát huy hiệu quả. Robot đã trở thành lĩnh vực phát triển nhanh nhất trên nền tảng Hugging Face, các mô hình của NVIDIA dẫn đầu về số lượt tải xuống. Các doanh nghiệp như Boston Dynamics, Caterpillar, Franka Robots và NEURA Robotics đã bắt đầu sử dụng công nghệ của NVIDIA.
Chiến lược này thể hiện ý đồ của công ty trong việc làm cho phát triển robot dễ tiếp cận hơn, đồng thời định vị mình như nhà cung cấp phần cứng và phần mềm nền tảng, tương tự vai trò của Android đối với các nhà sản xuất điện thoại thông minh.
Khi AI chuyển dịch từ đám mây sang các máy móc có khả năng học hỏi trong thế giới vật lý, các cảm biến rẻ hơn, công nghệ mô phỏng tiên tiến và các mô hình AI có khả năng tổng quát đa nhiệm đang thúc đẩy toàn bộ ngành chuyển đổi.