Nvidia mới nhất: GeForce RTX 50 được trang bị mô hình suy luận tăng tốc DeepSeek chạy cục bộ trên PC

02-01

Bài viết này được dịch máy

Xem bản gốc

Cuộc chiến AI Mỹ-Trung vẫn đang tiếp diễn, khi Trump chọn OpenAI làm đối tác chiến lược, DeepSeek đột nhiên xuất hiện trên toàn cầu, với lợi thế cạnh tranh cốt lõi là "mô hình suy luận" vẫn dựa vào sức mạnh của GPU của Nvidia để tăng tốc, nhanh chóng bác bỏ hoàn toàn các tin tức cho rằng GPU của Nvidia đã bị thay thế.

Trên blog chính thức của Nvidia, công ty tiết lộ rằng mô hình DeepSeek-R1 có thể cho phép các đội ngũ phát triển chạy các phép tính toán và mã code phức tạp mà vẫn bảo vệ được quyền riêng tư của khách hàng, với GPU GeForce RTX 50 Series của Nvidia có thể tăng tốc chạy mô hình suy luận DeepSeek với tốc độ 3.352 TFlops.

Mục lục

Toggle

Mô hình suy luận mới giúp AI suy nghĩ và phản hồi

Mô hình suy luận (Reasoning Models) là một loại mô hình ngôn ngữ lớn mới, AI sẽ "suy nghĩ" và "phản hồi" lỗi giống như con người, vì vậy được gọi là "suy luận". Giống như cách con người giải quyết vấn đề, AI sử dụng nhiều suy nghĩ, hiểu biết và phản hồi để giải quyết vấn đề. Mô hình suy luận có thể hiểu nhu cầu sâu sắc của người dùng và cho phép AI cung cấp phản hồi về quá trình suy nghĩ của mô hình, từ đó tăng cường trải nghiệm người dùng, mở khóa quy trình công việc của AI Agent và giải quyết các nhiệm vụ phức tạp nhiều bước như phân tích thị trường, các vấn đề toán học phức tạp hoặc mã code.

Mô hình suy luận DeepSeek có thể chạy nhanh trên RTX AI PC của Nvidia

Dòng mô hình gọn nhẹ DeepSeek-R1 dựa trên mô hình chuyên gia hỗn hợp (MoE) lớn với 671 tỷ tham số. Mô hình MoE bao gồm nhiều mô hình chuyên gia nhỏ hơn để giải quyết các vấn đề phức tạp. DeepSeek phân bổ công việc và giao các nhiệm vụ phụ cho các nhóm chuyên gia nhỏ hơn.

DeepSeek sử dụng một kỹ thuật gọi là Distillation (chưng cất), tương tự như sản xuất whisky, để lọc ra các mô hình học sinh nhỏ hơn từ mô hình lớn 671 tỷ tham số của DeepSeek, với số lượng tham số từ 150 triệu đến 70 tỷ. Mô hình lớn DeepSeek-R1 671 tỷ tham số "truyền" khả năng suy luận cho các mô hình học sinh Llama và Qwen nhỏ hơn, tạo ra các mô hình suy luận mạnh mẽ nhưng nhỏ hơn, có thể chạy nhanh trên RTX AI PC của Nvidia.

RTX tích hợp mô hình suy luận DeepSeek-R1

GPU GeForce RTX 50 của Nvidia được xây dựng dựa trên Tensor Core thế hệ thứ 5, trên cùng kiến trúc GPU Blackwell. Việc tăng tốc mô hình suy luận DeepSeek sẽ cung cấp hiệu suất suy luận tối ưu trên máy tính AI PC.

Nền tảng RTX AI của NVIDIA cung cấp nhiều công cụ AI, bộ phát triển phần mềm và lựa chọn mô hình. Hiện có hơn 100 triệu máy tính RTX AI PC (bao gồm PC có GPU GeForce RTX 50 Series) có thể sử dụng tính năng của DeepSeek-R1 trên toàn cầu.

GPU sát thủ có thể sử dụng mà không cần kết nối mạng

GPU RTX có thể chạy trong môi trường độ trễ thấp ngay cả khi không có kết nối mạng, đồng thời bảo vệ quyền riêng tư của khách hàng vì người dùng không cần phải tải lên dữ liệu cá nhân và lịch sử tìm kiếm lên hệ thống dịch vụ AI.

Cảnh báo rủi ro

Đầu tư vào tiền điện tử có rủi ro cao, giá có thể biến động mạnh và bạn có thể mất toàn bộ số vốn đầu tư. Vui lòng đánh giá cẩn thận các rủi ro.

Nguồn

Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.

Thích

Thêm vào Yêu thích

Bình luận

Chia sẻ

Nội dung liên quan