Những điều bạn cần biết về thông báo AI của Nvidia tại CES 2025

avatar
Decrypt
01-08
Bài viết này được dịch máy
Xem bản gốc
Sau một năm 2024 kỷ lục, Nvidia đang khởi đầu năm 2025 với một tiếng nổ lớn, ra mắt một loạt sản phẩm có thể củng cố vị thế thống trị của họ trong lĩnh vực phát triển AI và trò chơi điện tử. Giám đốc điều hành Jensen Huang đã lên sân khấu tại CES ở Las Vegas để giới thiệu các sản phẩm phần cứng và phần mềm mới, bao gồm mọi thứ từ máy tính siêu cao cấp cá nhân đến thế hệ tiếp theo của các thẻ đồ họa dành cho game. Thông báo lớn nhất của Nvidia: Dự án DIGITS, một máy tính siêu cao cấp cá nhân trị giá 3.000 USD, tích hợp một petaflop sức mạnh tính toán trong một hộp kích thước để bàn. Được xây dựng xung quanh chip siêu máy tính Grace Blackwell GB10 mới - và cho đến nay vẫn là bí mật - máy này có thể xử lý các mô hình AI lên đến 200 tỷ tham số trong khi chỉ sử dụng nguồn điện tiêu chuẩn. Đối với các tải trọng nặng hơn, người dùng có thể kết nối hai đơn vị để xử lý các mô hình lên đến 405 tỷ tham số. Để so sánh, mô hình Llama 3.2 lớn nhất, LLM nguồn mở tiên tiến nhất từ Meta, có 405 tỷ tham số và không thể chạy trên phần cứng dành cho người tiêu dùng. Cho đến nay, nó yêu cầu khoảng 8 chip siêu máy tính Nvidia A100/H100, mỗi chip có giá khoảng 30.000 USD, tổng cộng hơn 240.000 USD chỉ cho phần cứng xử lý. Hai máy tính siêu cao cấp dành cho người tiêu dùng mới của Nvidia sẽ có giá 6.000 USD và có thể chạy được cùng một mô hình định lượng. "AI sẽ trở thành xu hướng chính trong mọi ứng dụng cho mọi ngành công nghiệp. Với Dự án DIGITS, chip siêu máy tính Grace Blackwell sẽ đến với hàng triệu nhà phát triển", Jensen Huang, Giám đốc điều hành của Nvidia, cho biết trong một bài đăng trên blog chính thức. Đối với những người yêu thích các chi tiết kỹ thuật, chip GB10 đại diện cho một thành tựu kỹ thuật đáng kể, được sinh ra từ sự hợp tác với MediaTek. Hệ thống trên chip kết hợp kiến trúc GPU mới nhất của Nvidia với 20 lõi ARM tiết kiệm năng lượng được kết nối thông qua giao diện NVLink-C2C. Mỗi đơn vị DIGITS có 128GB bộ nhớ thống nhất và lên đến 4TB bộ nhớ NVMe. Một lần nữa, để so sánh, các GPU mạnh nhất cho đến nay chỉ có khoảng 24GB VRAM (bộ nhớ cần thiết để chạy các mô hình AI), và chip siêu máy tính H100 bắt đầu từ 80GB VRAM. đang vội vã triển khai các tác nhân AI, và Nvidia biết điều này, có lẽ đó là lý do tại sao họ đã phát triển Nemotron, một gia đình mô hình mới với ba kích thước, và công bố sự mở rộng ngày hôm nay với hai mô hình mới: Nvidia NIIM để tóm tắt và hiểu video và Nvidia Cosmos để cung cấp cho Nemotron khả năng nhìn thấy - khả năng hiểu các hướng dẫn trực quan. Cho đến nay, các chỉ dựa trên văn bản. Tuy nhiên, các mô hình này đã vượt trội trong các hướng dẫn sau: trò chuyện, gọi hàm, lập trình và các nhiệm vụ toán học. Chúng có sẵn thông qua cả Hugging Face và trang web của Nvidia, với quyền truy cập dành cho doanh nghiệp thông qua nền tảng phần mềm Nvidia AI Enterprise. Một lần nữa, để so sánh, trong , Llama Nemotron 70b của Nvidia xếp cao hơn Llama 405b gốc do Meta phát triển. Nó cũng vượt qua các phiên bản khác của Claude, Gemini Advanced, Grok-2 mini và GPT-4o. Sự đẩy mạnh tác nhân của Nvidia hiện cũng liên quan đến cơ sở hạ tầng. Công ty đã công bố các đối tác với các nhà cung cấp công nghệ tác nhân lớn như LangChain, LlamaIndex và CrewAI để xây dựng các bản thiết kế trên Nvidia AI Enterprise. Những mẫu sẵn sàng triển khai này giải quyết các nhiệm vụ cụ thể, giúp các nhà phát triển dễ dàng xây dựng các tác nhân chuyên biệt hơn. Một mẫu chuyển đổi PDF sang podcast mới nhằm cạnh tranh với NotebookLM của Google, trong khi một mẫu khác giúp xây dựng các tác nhân tìm kiếm và tóm tắt video. Các nhà phát triển có thể thử nghiệm các mẫu này thông qua nền tảng Nvidia Launchables mới, cho phép triển khai và thử nghiệm bằng một cú nhấp chuột. Nvidia dành phần công bố về trò chơi điện tử cho cuối cùng, ra mắt Dòng GeForce RTX 5000 được mong đợi. Mẫu cờ đầu RTX 5090 có 92 tỷ bóng bán dẫn và cung cấp 3.352 nghìn tỷ phép tính AI mỗi giây - gấp đôi hiệu suất của RTX 4090 hiện tại. Toàn bộ dòng sản phẩm có Tensor Core thế hệ thứ năm và RT Core thế hệ thứ tư. Các thẻ mới giới thiệu DLSS 4, có thể tăng tốc độ khung hình lên đến 8 lần bằng cách sử dụng AI để tạo ra nhiều khung hình mỗi lần hiển thị. "Blackwell, động cơ của AI, đã đến với game thủ PC, nhà phát triển và những người sáng tạo", Jensen Huang cho biết, "kết hợp rendering neural do AI điều khiển và ray tracing, Blackwell là sự đổi mới đáng kể nhất về đồ họa máy tính kể từ khi chúng tôi giới thiệu bóng chương trình 25 năm trước." Các thẻ mới cũng sử dụng các mô hình transformer để siêu phân giải, hứa hẹn đồ họa siêu thực và hiệu suất cao hơn nhiều so với mức giá - mà không hề rẻ, btw: 549 USD cho RTX 5070, 749 USD cho 5070 Ti, 999 USD cho 5080 và 1.999 USD cho 5090. Nếu bạn không có số tiền đó và muốn chơi game, đừng lo lắng. AMD cũng công bố hôm nay dòng Radeon RX 9070. Các thẻ này được xây dựng trên kiến trúc RDNA 4 mới sử dụng quy trình sản xuất 4nm và có bộ gia tốc AI chuyên dụng để cạnh tranh với tensor core của Nvidia. Mặc dù các thông số kỹ thuật đầy đủ vẫn chưa được tiết lộ, các chip Ryzen AI mới nhất của AMD đã đạt 50 ở hiệu suất đỉnh. Đáng tiếc, Nvidia vẫn là vua của các ứng dụng AI nhờ công nghệ CUDA, kiến trúc AI chuyên dụng của Nvidia. Để giải quyết vấn đề này, AMD đã ký các thỏa thuận đối tác với HP và Asus để tích hợp hệ thống, và hơn 100 thương hiệu nền tảng doanh nghiệp sẽ sử dụng công nghệ AMD Pro thông qua năm 2025. Các thẻ Radeon dự kiến sẽ ra mắt vào Quý 1 năm 2025, mang lại một cuộc chiến thú vị cho Nvidia cả trong lĩnh vực trò chơi điện tử và gia tốc AI.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận