Nvidia đã bán rất nhiều chip máy tính cho mọi công ty lớn đang xây dựng các mô hình trí tuệ nhân tạo riêng. Nhưng bây giờ, vào thời điểm khi sự quan tâm của công chúng đối với nguồn mở và tự làm AI đang tăng lên, công ty đã thông báo sẽ bắt đầu cung cấp một "máy tính siêu cao cấp cá nhân", bắt đầu từ $3,000 vào cuối năm nay mà bất kỳ ai cũng có thể sử dụng tại nhà hoặc văn phòng của họ.
Máy tính để bàn mới của Nvidia, có tên là Digits, sẽ được bán vào tháng 5 và có kích thước khoảng bằng một cuốn sách nhỏ. Nó chứa một "siêu chip" Nvidia được gọi là GB10 Grace Blackwell được tối ưu hóa để tăng tốc các phép tính cần thiết để huấn luyện và chạy các mô hình AI, và được trang bị 128GB bộ nhớ thống nhất và lên đến 4TB lưu trữ NVMe để xử lý các chương trình AI đặc biệt lớn.
Jensen Huang, nhà sáng lập và Giám đốc điều hành của Nvidia, đã công bố hệ thống mới này, cùng với một số sản phẩm AI khác, trong bài phát biểu chính tại CES, một hội nghị thường niên dành cho ngành công nghiệp máy tính được tổ chức tại Las Vegas (bạn có thể kiểm tra tất cả các thông báo lớn nhất trên blog trực tiếp CES của WIRED).
"Đặt một máy tính siêu cao cấp AI trên bàn làm việc của mỗi nhà khoa học dữ liệu, nhà nghiên cứu AI và sinh viên sẽ trao quyền cho họ tham gia và định hình kỷ nguyên của AI", Huang cho biết trong một tuyên bố được phát hành trước bài phát biểu chính của ông.
Nvidia cho biết máy Digits, được viết tắt là "hệ thống đào tạo trí tuệ GPU học sâu", sẽ có thể chạy một mô hình ngôn ngữ lớn duy nhất với tối đa 200 tỷ tham số, một thước đo sơ bộ về độ phức tạp và kích thước của một mô hình. Để làm điều này ngày nay, bạn sẽ cần thuê không gian từ một nhà cung cấp dịch vụ đám mây như AWS hoặc Microsoft, hoặc xây dựng một hệ thống tùy chỉnh với một số chip được thiết kế để chạy AI. Nếu hai máy Digits được kết nối bằng một liên kết liên kết tốc độ cao riêng, Nvidia cho biết chúng sẽ có thể chạy phiên bản mạnh nhất hiện có của mô hình Llama nguồn mở của Meta, có 405 tỷ tham số.
Digits sẽ giúp các nhà sưu tầm và nhà nghiên cứu dễ dàng thử nghiệm với các mô hình tiến gần đến các khả năng cơ bản của GPT-4 của OpenAI hoặc Gemini của Google trong văn phòng hoặc tầng hầm của họ. Nhưng các phiên bản tốt nhất của những mô hình độc quyền đó, được lưu trữ trong các trung tâm dữ liệu khổng lồ thuộc sở hữu của Microsoft và Google, có khả năng lớn hơn và mạnh hơn bất cứ thứ gì mà Digits có thể xử lý.
Nvidia đã là một trong những người hưởng lợi lớn nhất từ cơn bùng nổ của AI. Giá cổ phiếu của công ty đã tăng vọt trong vài năm qua khi các công ty công nghệ lao vào mua số lượng lớn các chip phần cứng tiên tiến mà nó sản xuất, một thành phần quan trọng để phát triển AI tiên tiến. Công ty đã chứng tỏ khả năng tạo ra phần cứng và phần mềm được tối ưu hóa cho AI, và lộ trình sản phẩm của nó đã trở thành tín hiệu quan trọng về hướng mà ngành công nghiệp dự kiến sẽ phát triển tiếp theo.
Khi được phát hành, Digits sẽ là phần cứng máy tính dành cho người tiêu dùng mạnh mẽ nhất mà Nvidia cung cấp. Công ty đã bán một loạt các bộ vi xử lý cho phát triển AI có tên là Jetson, bắt đầu từ khoảng $250. Những thiết bị này có thể chạy các mô hình AI nhỏ hơn và có thể được sử dụng như một máy tính để bàn mini hoặc được cài đặt trên một robot để thử nghiệm các chương trình AI khác nhau.
Ngoài hệ thống máy tính để bàn mới, Nvidia cho biết hôm nay họ sẽ sớm phát hành một số công cụ phần mềm để xây dựng và kết nối các "tác nhân AI", hay các chương trình sử dụng các mô hình ngôn ngữ lớn để thực hiện các nhiệm vụ hữu ích một cách tự động thay mặt cho mọi người. Điều này bao gồm một số phiên bản tùy chỉnh của Llama có tên là Nemotron được tinh chỉnh và tối ưu hóa để thực hiện các hướng dẫn và lập kế hoạch hành động để thực hiện các nhiệm vụ đại diện. Các tác nhân đã trở thành xu hướng nóng nhất trong lĩnh vực AI, và nhiều công ty xem chúng là một cách để kết hợp công nghệ này vào hoạt động của họ để tăng hiệu quả và tiết kiệm chi phí.
"AI đại diện là ranh giới tiếp theo của sự phát triển AI, và thực hiện cơ hội này yêu cầu tối ưu hóa toàn bộ hệ thống các mô hình ngôn ngữ lớn để cung cấp các tác nhân AI hiệu quả và chính xác", Ahmad Al-Dahle, Phó chủ tịch và Trưởng bộ phận GenAI tại Meta, cho biết trong một tuyên bố.
Jensen cho biết trong bài phát biểu chính tại CES rằng Nvidia kỳ vọng các công ty sẽ xây dựng và duy trì các tác nhân AI bằng công nghệ của họ. "Theo nhiều cách, bộ phận CNTT của mỗi công ty sẽ là bộ phận Nhân sự của các tác nhân AI trong tương lai", Giám đốc điều hành nói. "Trong tương lai, họ sẽ duy trì, nuôi dưỡng, tuyển dụng và cải thiện một loạt các tác nhân AI."





