
Tại CES 2026, NVIDIA đã chính thức ra mắt Alpamayo, một hệ sinh thái hoàn chỉnh bao gồm các mô hình AI mã nguồn mở, công cụ mô phỏng và dữ liệu lái xe thực tế, nhằm mục đích đẩy nhanh sự phát triển của công nghệ lái xe tự động có khả năng "suy luận". Hệ thống này nhắm đến các tình huống hiếm gặp mà xe tự lái khó xử lý – những điều kiện đường xá phức tạp, hiếm khi được ghi nhận trong dữ liệu trước đây. Mục tiêu là giúp xe không chỉ nhìn thấy mà còn hiểu được tình huống, suy luận về nguyên nhân và kết quả, và giải thích rõ ràng lý do tại sao chúng đưa ra những quyết định lái xe nhất định, giống như con người.
Hệ sinh thái mã nguồn mở Alpamayo được ra mắt, ba tính năng cốt lõi được công bố.
Tại CES , CEO của Nvidia, Jensen Huang, đã tiết lộ cấu trúc hoàn chỉnh của dòng sản phẩm Alpamayo, bao gồm ba yếu tố cốt lõi:
Mô hình VLA với "Quy trình tư duy"
Hệ thống mô phỏng lái xe tự động hoàn toàn mã nguồn mở, cực kỳ chân thực.
Cơ sở dữ liệu lái xe thực tế quy mô lớn, liên vùng.
Huang Renxun cho biết thiết kế này nhằm giải quyết các vấn đề an toàn và nhiều thách thức khác nhau của việc lái xe tự động trong thế giới thực đối diện các tình huống khó lường.
(Lưu ý: Mô hình VLA, viết tắt của Vision-Language-Action (Thị giác-Ngôn ngữ-Hành động), là một kiến trúc mô hình trí tuệ nhân tạo tích hợp khả năng nhìn, nghe và sau đó là hành động.)
Max Pain đối với các tour tự lái vẫn là tình huống "đuôi dài", điều này vẫn là một trở ngại về an toàn.
Huang Renxun chỉ ra rằng các hệ thống lái tự động phải hoạt động trong điều kiện đường sá vô cùng đa dạng, và những khó khăn thực sự thường không nằm ở các tình huống hàng ngày, mà ở những tình huống hiếm gặp nhưng có rủi ro cao, chẳng hạn như tai nạn bất ngờ, hành vi giao thông bất thường hoặc các yếu tố hoàn cảnh đặc biệt.
Các kiến trúc lái xe tự động truyền thống chủ yếu xử lý "nhận thức" và "lập kế hoạch" một cách riêng biệt. Cách tiếp cận này có mở rộng hạn chế khi gặp phải các tình huống chưa biết hoặc mới. Mặc dù học tập từ đầu đến cuối đã có những tiến bộ trong những năm gần đây, Huang Renxun cho rằng rằng để thực sự khắc phục vấn đề "đuôi dài", hệ thống phải có "khả năng suy luận nhân quả" và có thể hiểu được mối quan hệ giữa các sự kiện, chứ không chỉ đơn thuần áp dụng các mô hình hiện có.
Khái niệm cốt lõi của Alpamayo là làm cho chiếc xe trở nên rõ ràng từng bước một.
Hệ thống Alpamayo tích hợp khái niệm Chuỗi tư duy, tạo ra mô hình VLA với khả năng suy luận. Điều này cho phép hệ thống lái tự động dần dần suy ra logic hành động khi gặp phải các tình huống mới hoặc hiếm gặp. Sau đây là ba khả năng chính của Alpamayo:
Nhận thức thị giác : hiểu biết về con đường và hoàn cảnh xung quanh.
Hiểu ngôn ngữ : Nắm bắt ngữ cảnh và mạch văn.
Tạo ra hành động : Các quyết định lái xe thực tế được tạo ra.
Jensen Huang nhấn mạnh rằng thiết kế này không chỉ nâng cao khả năng lái xe mà còn cải thiện khả năng hiểu các quyết định, giúp xây dựng niềm tin vào sự an toàn của lái xe tự động. Hệ thống tổng thể dựa trên hệ thống an toàn Halos của Nvidia.
Lĩnh vực trí tuệ nhân tạo đang đạt đến một bước ngoặt quan trọng, trong đó taxi tự lái là lĩnh vực đầu tiên được hưởng lợi.
Jensen Huang tiếp tục nói rằng trí tuệ nhân tạo vật lý đang bước vào một bước ngoặt quan trọng, khi máy móc bắt đầu hiểu, suy luận và hành động trong thế giới thực, giống như ChatGPT đã thay đổi trí tuệ nhân tạo kỹ thuật số, và taxi tự lái sẽ là một trong những ứng dụng đầu tiên được hưởng lợi.
Ông nhấn mạnh rằng Alpamayo cho phép các phương tiện di chuyển an toàn trong hoàn cảnh phức tạp và giải thích lý do cho các quyết định của chúng, đây là nền tảng quan trọng để đạt được khả năng lái xe tự động mở rộng.
Ba trụ cột cùng lúc, tạo nên một hệ sinh thái mã mã nguồn mở hoàn chỉnh.
Nvidia định vị Alpamayo là một "mô hình huấn luyện", không phải để triển khai trực tiếp trên xe, mà là nền tảng để huấn luyện, tinh chỉnh và chắt lọc các mô hình khác được gắn trên xe.

(Lưu ý: Thuật ngữ "chưng cất" ở đây đề cập đến việc sử dụng khả năng suy luận của Alpamayo để sản xuất hàng loạt các mô hình tự lái có thể hoạt động ngay lập tức trong xe và vận hành ở mức độ gần như chuyên nghiệp.)
I. Alpamayo 1: Mô hình VLA tự lái đầu tiên với Chuỗi quy trình tư duy
Alpamayo 1 tự hào có 10 tỷ tham số và nhận video làm đầu vào, cho ra các quỹ đạo lái xe và quy trình suy luận hoàn chỉnh. Nó cũng cung cấp tỷ trọng mô hình và mã suy luận mã nguồn mở. Hiện tại, Alpamayo 1 có sẵn trên Hugging Face để phục vụ nghiên cứu và phát triển, các phiên bản tương lai sẽ mở rộng quy mô tham số, độ sâu suy luận và các tùy chọn thương mại.
(Lưu ý: Hugging Face được biết đến như là GitHub của thế giới AI, điểm nổi bật nhất của nó là kho lưu trữ mô hình mã nguồn mở, tích hợp lượng lớn mô hình và tập dữ liệu.)
II. AlpaSim: Một nền tảng mô phỏng lái xe tự động hoàn toàn mã nguồn mở
AlpaSim đã được phát hành trên GitHub và hỗ trợ mô hình hóa cảm biến cực kỳ chân thực, cho phép người dùng thiết lập hành vi giao thông và thử nghiệm vòng kín, cũng như xác thực nhanh chóng và tối ưu hóa chiến lược.
III. Bộ dữ liệu mở về Trí tuệ nhân tạo vật lý: Dữ liệu lái xe thực tế quy mô lớn
Bộ dữ liệu mở về Trí tuệ Nhân tạo Vật lý (Physical AI Open Datasets) sở hữu cơ sở dữ liệu hơn 1.700 giờ dữ liệu lái xe, bao gồm nhiều khu vực địa lý và điều kiện hoàn cảnh khác nhau, tập trung vào các tình huống hiếm gặp và phức tạp, và cũng có sẵn để tải xuống trên Hugging Face.
Huang Renxun cho rằng sự kết hợp của ba yếu tố này có thể tạo thành một chu kỳ nghiên cứu và phát triển tự củng cố, đẩy nhanh quá trình hoàn thiện công nghệ lái xe tự động dựa trên lý luận.
Các nhà sản xuất ô tô và các nhà lãnh đạo ngành đã bày tỏ sự ủng hộ, hướng tới mục tiêu lái xe tự động cấp độ 4.
Một số nhà sản xuất ô tô và viện nghiên cứu đã bày tỏ sự quan tâm đến Alpamayo, bao gồm Lucid , JLR , Uber và công ty nghiên cứu Berkeley DeepDrive . Tất cả các bên đều đồng ý rằng trí tuệ nhân tạo với khả năng suy luận, hoàn cảnh mô phỏng mở và dữ liệu chất lượng cao sẽ là những yếu tố then chốt không thể thiếu để thúc đẩy khả năng lái xe tự động cấp độ 4.
(Lưu ý: Cấp độ 1-2 là lái xe có hỗ trợ, Cấp độ 3 là giai đoạn chuyển tiếp, và Cấp độ 4 là khi bạn có thể thực sự bắt đầu lái xe mà không cần người lái.)
Việc tích hợp sâu hơn với các thành viên khác trong hệ sinh thái Nvidia sẽ hỗ trợ việc triển khai thương mại.
Ngoài Alpamayo, các nhà phát triển cũng có thể sử dụng nó với các nền tảng NVIDIA khác, bao gồm Cosmos và Omniverse, và tích hợp mô hình vào kiến trúc NVIDIA DRIVE Hyperion, sử dụng nền tảng điện toán DRIVE AGX Thor.
NVIDIA cho biết quy trình phát triển có thể kiểm chứng hiệu năng trong hoàn cảnh mô phỏng trước khi chuyển sang triển khai thương mại thực tế, nhấn mạnh cả tính an toàn và mở rộng. Thiết kế quy trình này cho phép công nghệ lái xe tự động tránh việc phải bắt đầu lại từ đầu giữa "giai đoạn nghiên cứu" và "triển khai thương mại", thay vào đó cho phép nó dần dần chuyển từ mô phỏng sang xe thực tế trong cùng một kiến trúc. Bằng cách liên tục kiểm chứng tính an toàn và ổn định trong hoàn cảnh ảo trước khi tiến hành thử nghiệm thực tế trên đường, rủi ro được giảm thiểu, mở rộng được cải thiện, và các nhà sản xuất ô tô và nhà phát triển có một lộ trình rõ ràng và dễ kiểm soát hơn khi tiến hành thương mại hóa.
Bài viết này, "Hệ sinh thái Alpamayo ra mắt: Cung cấp khả năng suy luận cho xe tự lái bằng trí tuệ nhân tạo và giải thích lý do cho các quyết định," lần đầu tiên xuất hiện trên ABMedia .





