DeepSeek đã thay đổi AI mãi mãi như thế nào và nó có ý nghĩa gì đối với sức mạnh tính toán

02-28

Bài viết này được dịch máy

Xem bản gốc

Cách DeepSeek đã thay đổi AI mãi mãi và ý nghĩa của nó đối với Công suất tính toán

Thành công gần đây của DeepSeek, một startup AI Trung Quốc đã huấn luyện một mô hình tương đương với GPT-4 chỉ với 5,6 triệu USD, đã làm chấn động thị trường AI. Bước đột phá này đã đặt câu hỏi về tiền đề rằng xây dựng AI mạnh mẽ tốn hàng tỷ đô la. Trong khi một số người xem đây là một dấu hiệu cho thấy chi phí tính toán AI có thể giảm, thì khả năng cao là điều ngược lại. Thành công của DeepSeek cho thấy sự gia tăng sắp xảy ra trong nhu cầu về công suất tính toán, điều này có tiềm năng gây rối loạn toàn bộ hệ sinh thái AI.

Tại sao máy tính rẻ hơn lại thúc đẩy nhu cầu?

Để hiểu tương lai của tính toán AI, hãy xem xét Định lý Jevons. Vào thế kỷ 19, nhà kinh tế William Jevons đã nhận ra rằng những tiến bộ trong hiệu quả của máy hơi nước đã dẫn đến việc tiêu thụ than tăng lên. Chi phí thấp hơn cho phép sử dụng nhiều hơn, thúc đẩy nhu cầu tổng thể tăng lên.

Một mô hình tương tự cũng áp dụng cho tính toán AI. Khi chi phí huấn luyện các mô hình tinh vi giảm, nhiều doanh nghiệp và nhà phát triển hơn sẽ tham gia lĩnh vực này:

Các startup trước đây không thể chi trả cho AI có thể bây giờ khám phá những ý tưởng tham vọng.
Các doanh nghiệp sợ tự động hóa hoạt động của họ sẽ áp dụng các công nghệ AI.
Các ngành không có trường hợp sử dụng AI rõ ràng sẽ bắt đầu điều tra các ứng dụng.

Khi tiếp cận được mở rộng, nhu cầu về tài nguyên tính toán dự kiến sẽ tăng lên đáng kể. Morgan Stanley dự đoán rằng nhu cầu tính toán AI sẽ tăng gấp đôi mỗi sáu tháng, ngụ ý rằng vào năm 2030, việc huấn luyện một hệ thống trí tuệ nhân tạo tổng quát (AGI) có thể tiêu thụ nhiều năng lượng như một quốc gia nhỏ.

Một thị trường do Big Tech thống trị

Ngành công nghiệp tính toán AI hiện đang do ba công ty thống trị: Amazon Web Services, Google Cloud Platform và Microsoft Azure. Mặc dù các tập đoàn này cung cấp cơ sở hạ tầng quan trọng, nhưng sự thống trị của họ tạo ra những rào cản đối với các nhà chơi nhỏ hơn và đổi mới nói chung.

GPU hiệu suất cao, như H100 và H200 của Nvidia, là cần thiết để huấn luyện các mô hình hiện đại. Tuy nhiên, các tài nguyên này thường được dành riêng cho các sáng kiến nội bộ của Big Tech hoặc các khách hàng lớn của họ. Các nhà phát triển và doanh nhân thường phải đối mặt với thời gian chờ đợi dài hoặc bị từ chối truy cập hoàn toàn.

Ngay cả khi có thể truy cập, chi phí cũng có thể quá cao. AWS tính khoảng 14 USD mỗi giờ mỗi GPU H100, trong khi GCP tính khoảng 6-7 USD mỗi giờ. Những chi phí này tạo ra rào cản đối với các doanh nghiệp và nhà nghiên cứu nhỏ hơn, làm giảm khả năng cạnh tranh với các công ty có nguồn tài chính lớn.

Xây dựng một công ty phụ thuộc vào AI trên cơ sở hạ tầng của Big Tech có nhiều rủi ro. Các công ty chi tiêu nhiều cho việc huấn luyện mô hình có thể gặp phải các hạn chế về truy cập hoặc các khoản phí bổ sung. Các mối quan hệ hợp tác sâu sắc giữa các nhà cung cấp dịch vụ đám mây và các nhà phát triển AI hàng đầu, như hợp tác giữa Microsoft và OpenAI, làm tăng lo ngại về thiên vị và hạn chế truy cập.

Sự tập trung của năng lực tính toán vào tay một số ít công ty nhấn mạnh sự cần thiết phải có các nhà cung cấp độc lập. Exabits đang nổi lên như một lựa chọn như vậy, với mục tiêu làm cho cơ sở hạ tầng AI trở nên dễ tiếp cận hơn với mọi người.

Exabits nổi bật bằng cách cung cấp các hệ thống tính toán hiệu suất cao được tối ưu hóa cho các ứng dụng AI. Khác với một số sáng kiến tính toán phân tán đang gặp khó khăn về tính ổn định, Exabits cung cấp các cụm GPU có thể thực hiện các hoạt động AI quy mô lớn.

Nhận thức được rằng nhu cầu tính toán AI sẽ tiếp tục tăng, Exabits đang tăng cường năng lực của mình trên các vị trí khác nhau. Phương pháp này đảm bảo tính sẵn có liên tục, cho phép các công ty phát triển một cách suôn sẻ.

Công ty hứa hẹn sẽ làm cho công suất tính toán rẻ hơn. Mặc dù giá cụ thể thay đổi theo mức sử dụng và địa lý, nhưng công ty định vị mình là một lựa chọn rẻ hơn so với AWS và GCP. Chi phí thấp hơn có thể cho phép các startup, doanh nghiệp vừa và nhỏ và các nhà nghiên cứu theo đuổi phát triển AI mà không bị ràng buộc về tài chính.

Đảm bảo quyền truy cập vào các GPU hiệu suất cao vẫn là ưu tiên hàng đầu. Exabits cung cấp nhiều loại phần cứng khác nhau, bao gồm cả Nvidia H100 và H200, cũng như các mẫu khác như 4090, A100, Ade6000 và MI50. Việc có sẵn khoảng 60.000 GPU, bao gồm 3.000 H100 và 4.000 H200, cung cấp cho khách hàng các tài nguyên cần thiết để huấn luyện các mô hình phức tạp.

Hàm ý của một thị trường tính toán AI mở

Khi các khả năng AI tiến triển đến AGI, công suất tính toán sẽ đóng vai trò quan trọng trong việc định hình tương lai. Nếu Big Tech duy trì vị trí thống trị của mình, họ có thể hiệu quả hạn chế quyền truy cập vào việc phát triển và triển khai AGI. Điều này đặt ra những câu hỏi về tính cạnh tranh, đổi mới và việc chia sẻ công bằng các lợi ích của AI.

Ngược lại, một môi trường tính toán đa dạng có thể thúc đẩy một tương lai mở và bao trùm hơn. Các công ty như Exabits cung cấp một khuôn khổ thay thế mà trong đó các startup, nhà nghiên cứu và công ty đều có quyền truy cập công bằng vào cơ sở hạ tầng cần thiết cho đổi mới AI.

Chuẩn bị cho sự gia tăng tính toán AI

Thành tích của DeepSeek không có nghĩa là nghiên cứu AI sẽ trở nên ít tốn kém về tài nguyên hơn. Nó cho thấy AI đang trở nên dễ tiếp cận hơn, dẫn đến nhu cầu tăng cao về tài nguyên xử lý. Mô hình tăng trưởng này phù hợp với Định lý Jevons, cho rằng những cải tiến về hiệu quả sẽ dẫn đến việc áp dụng và tiêu thụ tăng lên.

Sự thống trị hiện tại của Big Tech đối với cơ sở hạ tầng AI tạo ra những rào cản đối với các startup và toàn ngành nói chung. Quyền truy cập hạn chế, chi phí cao và các rủi ro phụ thuộc nhấn mạnh tầm quan trọng của các nhà cung cấp thay thế. Exabits tự xác định mình là một lựa chọn khả thi với hiệu suất cấp doanh nghiệp, khả năng mở rộng, giá cả thấp và quyền truy cập vào các GPU tiên tiến nhất. Các công ty như Exabits có thể đóng vai trò quan trọng trong việc tạo ra một tương lai mà trong đó phát triển AI không chỉ giới hạn ở một số ít mà có sẵn cho các nhà sáng tạo trên toàn thế giới.

Bài viết Cách DeepSeek đã thay đổi AI mãi mãi và ý nghĩa của nó đối với Công suất tính toán đầu tiên xuất hiện trên Metaverse Post.

Nguồn

Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.

Thích

Thêm vào Yêu thích

Bình luận

Chia sẻ

Nội dung liên quan