Các doanh nghiệp đang vượt qua một bước ngoặt mới trong việc ứng dụng trí tuệ nhân tạo. Ngày nay, trọng tâm của thị trường không chỉ đơn thuần là liệu có nên đầu tư vào AI hay không, mà là làm thế nào để triển khai đúng các chất bán dẫn và cơ sở hạ tầng cho việc kinh doanh khác nhau nhằm tối đa hóa hiệu quả chi phí. Đặc biệt với sự gia tăng nhanh chóng của nhiệm vụ"AI tác nhân" và chi phí suy luận tăng, thách thức cốt lõi đối với các doanh nghiệp lớn không còn là việc lựa chọn mù quáng thiết bị có hiệu suất cao nhất, mà là lựa chọn các nguồn lực tính toán phù hợp dựa trên mục tiêu của họ - tức là đưa ra "sự lựa chọn".
Trong bối cảnh đó, mối quan hệ hợp tác giữa AMD và Red Hat một lần nữa lại trở thành tâm điểm chú ý. John Hampton, Phó Chủ tịch phụ trách Kinh doanh Công nghệ Doanh nghiệp Toàn cầu của AMD, đã chỉ ra tại Hội nghị thượng đỉnh Red Hat 2026 ở Boston rằng các doanh nghiệp đang tìm kiếm cơ sở hạ tầng AI linh hoạt hơn trong hoàn cảnh lai. Ông lưu ý rằng nhiều khách hàng gần đây đã vội vàng xây dựng các cụm GPU quy mô lớn để đáp ứng nhu cầu AI, nhưng đang phải đối mặt với áp lực chi phí lớn hơn nhiều so với dự kiến trong quá trình vận hành thực tế.
Chi phí suy luận AI tăng mạnh... Các doanh nghiệp đang đánh giá lại chiến lược duy nhất sử dụng GPU hiệu năng cao của mình.
Theo Hampton, nhiều công ty tập trung vào việc mua lượng lớn GPU hiệu năng cao để tránh bị tụt hậu trong giai đoạn đầu của cuộc đua AI. Vấn đề là khi quy mô dịch vụ tăng lên, chi phí cho lần truy vấn AI tích lũy dần, gây áp lực ngân sách ngày càng lớn. Hiện tượng này được biết đến trong ngành là "kinh tế token", có nghĩa là khi việc sử dụng AI tạo sinh tăng lên, chi phí xử lý token cũng tăng, ảnh hưởng trực tiếp đến lợi nhuận của công ty.
Ông ấy phát biểu: "Ban đầu, các doanh nghiệp mua các cụm GPU lượng lớn cho trí tuệ nhân tạo, nhưng giờ đây họ đang phải gánh chịu những hậu quả không thể chịu nổi. Trong khi các ứng dụng AI đang tăng trưởng, sự gia tăng nhanh chóng về chi phí đang gây ra những lo ngại đáng kể." Điều này cuối cùng có nghĩa là cốt lõi của các chiến lược AI trong doanh nghiệp đang chuyển từ "đảm bảo thiết bị hiệu năng cao nhất" sang "tối ưu hóa việc triển khai cho nhiệm vụ cụ thể".
AMD và Red Hat: Cung cấp các giải pháp "toàn diện" từ CPU đến GPU
Để giải quyết xu hướng này, AMD đã cho ra mắt danh mục sản phẩm "toàn diện" bao gồm CPU, GPU tiết kiệm chi phí và accelerator hiệu năng cao. Chiến lược của hãng là kết hợp phần cứng này với nền tảng phần mềm mã nguồn mở của Red Hat, cho phép các doanh nghiệp vận hành linh hoạt nhiệm vụ AI trong hoàn cảnh đám mây lai mà không cần phụ thuộc vào nhà cung cấp cụ thể nào.
Lấy AMD Instinct MI350P làm ví dụ, đây được mô tả là GPU dựa trên PCIe có thể dễ dàng tích hợp vào các máy chủ hiện có. Nó có thiết kế làm mát bằng không khí để tiết kiệm chi phí. Red Hat AI, với tư cách là một nền tảng cấp doanh nghiệp, hỗ trợ triển khai và mở rộng các tác nhân AI trên loại phần cứng này. Hơn nữa, việc tận dụng CPU AMD EPYC và các công cụ ảo hóa của Red Hat cho phép hợp nhất máy chủ, từ đó giúp giảm diện tích trung tâm dữ liệu và mức tiêu thụ điện năng.
Cốt lõi nằm ở "kiến trúc mở"... đồng thời thúc đẩy việc kiểm soát ngân sách AI và hiện đại hóa cơ sở hạ tầng.
Thông điệp cốt lõi lần là "sự cởi mở" và "sự chọn lọc". AMD, cùng với Red Hat, nhấn mạnh rằng so với một hệ sinh thái khép kín, các doanh nghiệp nên sử dụng kiến trúc mở để lựa chọn các tài nguyên phù hợp nhất từ CPU, GPU công suất thấp và accelerator hiệu năng cao cho các khối lượng công việc AI khác nhau. Không phải tất cả nhiệm vụ suy luận đều cần được triển khai trên thiết bị đắt tiền.
Lợi ích của phương pháp này không chỉ dừng lại ở việc giảm chi phí. Đối với các doanh nghiệp, nó cho phép họ tận dụng tối đa cơ sở hạ tầng hiện có mà không làm chậm quá trình ứng dụng AI, đồng thời cho phép họ tái đầu tư ngân sách và nguồn lực tiết kiệm được vào các dự án AI mới. Điều này có ý nghĩa thực tiễn rất lớn, cho phép hiện đại hóa đồng thời cơ sở hạ tầng AI và kiểm soát ngân sách.
Hampton dự đoán rằng tiêu chuẩn đánh giá thị trường AI trong tương lai có thể sẽ không còn là "những gì đã được mua", mà là "cách thức triển khai". Khi cuộc cạnh tranh giữa các công ty để phát triển AI chính thức bước vào giai đoạn vận hành, một số nhà phân tích cho rằng rằng chìa khóa thành công trong tương lai sẽ không nằm ở việc chứng minh hiệu suất, mà ở khả năng cân bằng khéo léo giữa tổng chi phí sở hữu và kết quả thực tế.
Ghi chú của TP AI: Bài viết này là bản tóm tắt dựa trên mô hình ngôn ngữ của TokenPost.ai. Thông tin quan trọng trong văn bản chính có thể bị lược bỏ hoặc khác với thực tế.





