DeepSeek AI thách thức lệnh cấm vận công nghệ của Hoa Kỳ, chính sách kiểm soát xuất khẩu vẫn đóng vai trò chủ chốt? Bình luận của CEO Anthropic

avatar
ABMedia
02-01
Bài viết này được dịch máy
Xem bản gốc
Dưới đây là bản dịch tiếng Việt của văn bản, với các từ viết tắt và thuật ngữ được dịch như hướng dẫn: Trong những năm gần đây, chính phủ Mỹ liên tục tăng cường kiểm soát xuất khẩu chip cao cấp sang Trung Quốc, nhằm hạn chế sự phát triển công nghệ trí tuệ nhân tạo (AI) của Trung Quốc. Tuy nhiên, mô hình AI mới được công ty AI Trung Quốc DeepSeek giới thiệu gần đây lại thể hiện khả năng tiệm cận với trình độ công nghệ tiên tiến của Mỹ, và chi phí đào tạo thấp hơn. Điều này có nghĩa là các biện pháp kiểm soát xuất khẩu của Mỹ đã thất bại? Hay những chính sách này vẫn là then chốt để duy trì ưu thế về công nghệ? Giám đốc điều hành của Anthropic, Dario Amodei, gần đây (1/30) đã chia sẻ quan điểm về sự phát triển của DeepSeek, cho rằng mặc dù sự tiến bộ của các công ty AI Trung Quốc gây chú ý, nhưng chưa làm lung lay mục tiêu cốt lõi của các biện pháp kiểm soát xuất khẩu. Trái lại, những diễn biến này càng làm nổi bật giá trị chiến lược của kiểm soát xuất khẩu đối với ưu thế cạnh tranh AI của Mỹ.

Ý nghĩa chiến lược của ưu thế AI và kiểm soát xuất khẩu của Mỹ

Dario Amodei cho biết, chính sách kiểm soát xuất khẩu của Mỹ nhằm đảm bảo các quốc gia dân chủ duy trì ưu thế về công nghệ trong lĩnh vực AI, chứ không chỉ đơn thuần ngăn chặn sự phát triển công nghệ của Trung Quốc.

Về lâu dài, các công ty AI của Mỹ phải dựa vào đổi mới công nghệ để duy trì vị thế dẫn đầu so với Trung Quốc. Tuy nhiên, do các công ty AI Trung Quốc vẫn đạt được tiến bộ trong điều kiện tài nguyên tính toán bị hạn chế, liệu Mỹ có nên nới lỏng các biện pháp phong tỏa công nghệ đối với Trung Quốc? Amodei cho rằng, suy luận như vậy là không đúng, thay vào đó, Mỹ cần tiếp tục tăng cường các chính sách kiểm soát xuất khẩu hiện có.

Sự phát triển của công nghệ AI liên quan đến ba động lực cốt lõi, hiểu rõ những động lực này sẽ giúp đánh giá ảnh hưởng của DeepSeek và định hướng tương lai của chính sách kiểm soát xuất khẩu của Mỹ.

Ba động lực cốt lõi trong phát triển công nghệ AI

1. Hiệu ứng quy mô hóa của mô hình AI (Scaling Laws)

Hiệu suất của mô hình AI tỷ lệ thuận với quy mô đào tạo, nghĩa là khi tài nguyên đào tạo tăng lên, hiệu suất của mô hình sẽ tăng theo. Ví dụ, khi nguồn vốn đào tạo AI tăng từ 1 triệu USD lên 100 triệu USD, hiệu suất của mô hình trong các nhiệm vụ nhận thức như lập trình có thể tăng từ 20% lên 60%. Mô hình tăng trưởng này thúc đẩy các công ty AI liên tục đầu tư vào nhiều tài nguyên tính toán hơn để đào tạo các hệ thống AI mạnh mẽ hơn.

2. Đột phá kỹ thuật và giảm chi phí (Shifting the Curve)

Công nghệ AI liên tục xuất hiện các sáng tạo mới, nâng cao hiệu quả hoạt động của mô hình và giảm chi phí đào tạo. Ví dụ, cải tiến thuật toán AI hoặc kiến trúc phần cứng có thể làm giảm 50% chi phí đào tạo AI cùng quy mô. Tuy nhiên, điều này không có nghĩa là các doanh nghiệp AI sẽ giảm đầu tư, mà sẽ đầu tư nguồn lực tiết kiệm được vào đào tạo quy mô lớn hơn để phát triển AI mạnh hơn. Nghiên cứu cho thấy, trong những năm gần đây, tốc độ giảm chi phí đào tạo AI khoảng 4 lần mỗi năm, và xu hướng này vẫn đang tiếp tục tăng tốc.

3. Cách mạng trong phương pháp đào tạo AI (Shifting the Paradigm)

Phương pháp đào tạo AI đang không ngừng phát triển, từ Pretraining quy mô lớn trước năm 2020 chuyển sang Reinforcement Learning (RL) nổi lên vào năm 2024. Phương pháp mới này có thể đáng kể cải thiện hiệu suất của AI trong các lĩnh vực cụ thể như lập luận toán học, lập trình. Hiện tại, các kỹ thuật Reinforcement Learning này vẫn ở giai đoạn sớm, do đó mức đầu tư tương đối nhỏ, nhưng có thể nâng cao nhanh chóng khả năng lập luận của AI.

Mô hình AI của DeepSeek có thay đổi cục diện ngành không?

DeepSeek-V3: Đột phá về hiệu quả kỹ thuật, chứ không phải đổi mới đột phá

Gần đây, DeepSeek đã ra mắt DeepSeek-V3, đây là một mô hình Pretraining thuần túy, có hiệu suất gần với các mô hình hàng đầu của Mỹ trong một số nhiệm vụ AI, nhưng chi phí đào tạo đáng kể thấp hơn. Các đổi mới kỹ thuật chính của DeepSeek tập trung vào tối ưu hóa kỹ thuật, chẳng hạn như tối ưu hóa Key-Value Cache và cải tiến Mixture of Experts (MoE), giúp mô hình AI phân bổ tài nguyên tính toán hiệu quả hơn.

Tuy nhiên, đánh giá bên ngoài về DeepSeek-V3 có phần phóng đại. Một số báo cáo cho rằng DeepSeek chỉ tốn 6 triệu USD để đạt được mức độ mà các công ty AI của Mỹ phải đầu tư hàng tỷ USD mới có thể. Tuy nhiên, lấy Claude 3.5 Sonnet làm ví dụ, chi phí đào tạo khoảng hàng chục triệu USD, và hiệu suất của DeepSeek-V3 vẫn thấp hơn các mô hình AI tiên tiến của Mỹ.

Xu hướng giảm chi phí đào tạo AI đã tồn tại nhiều năm, nghiên cứu cho thấy chi phí đào tạo AI giảm khoảng 4 lần mỗi năm, do đó sự tiến bộ của DeepSeek phù hợp với xu hướng này, chứ không phải là đột phá về kỹ thuật.

R1: Ứng dụng kỹ thuật Reinforcement Learning, chứ không phải tiến bộ cách mạng

Sau DeepSeek-V3, DeepSeek đã ra mắt R1, đây là một mô hình AI được tinh chỉnh bằng Reinforcement Learning, có hiệu suất tốt hơn trong các lĩnh vực như lập luận toán học và lập trình. Tuy nhiên, công nghệ này tương tự như o1-preview trước đây của OpenAI, không mang lại phương pháp đào tạo AI hoàn toàn mới, do đó không phải là đột phá kỹ thuật thực sự.

Kiểm soát xuất khẩu: Chìa khóa ngăn chặn mất cân bằng cạnh tranh AI

Cạnh tranh AI trong tương lai: Cục diện đơn cực hay song cực?

Sự tiến bộ của DeepSeek đã nêu lên một vấn đề quan trọng: Cạnh tranh AI trong tương lai sẽ có cục diện đơn cực hay cục diện song cực?

  • Cục diện song cực: Nếu Trung Quốc có thể có được hàng triệu chip tiên tiến, thì công nghệ AI của Mỹ và Trung Quốc sẽ ngang tầm, có thể dẫn đến sự không ổn định hơn trong cục diện công nghệ toàn cầu.
  • Cục diện đơn cực: Nếu Trung Quốc không thể có đủ tài nguyên tính toán, Mỹ sẽ duy trì vị thế dẫn đầu về công nghệ AI, tiếp tục củng cố vị thế bá chủ công nghệ toàn cầu.

Hiện tại, các doanh nghiệp AI của Mỹ sở hữu hàng triệu chip GPU cao cấp để đào tạo AI, trong khi năng lực tính toán AI của Trung Quốc bị hạn chế bởi chính sách kiểm soát xuất khẩu.

Hiệu quả của chính sách kiểm soát xuất khẩu

DeepSeek có khoảng 50.000 chip Hopper GPU, chủ yếu từ các lô hàng trước khi bị kiểm soát hoặc các mẫu không bị cấm (như H20). Điều này cho thấy chính sách kiểm soát xuất khẩu của Mỹ vẫn phát huy tác dụng, và chính phủ Mỹ đang chặn các lỗ hổng công nghệ để tiếp tục hạn chế Trung Quốc tiếp cận tài nguyên tính toán then chốt.

Chính sách kiểm soát xuất khẩu của Mỹ nhằm ngăn chặn Trung Quốc có được hàng triệu chip, chứ không phải hoàn toàn ngăn cản Trung Quốc tiếp cận phần cứng AI. Nếu Trung Quốc không thể vượt qua ngưỡng này, Mỹ sẽ duy trì vị thế dẫn đầu về AI, tiếp tục định hình cục diện cạnh tranh công nghệ toàn cầu.

Kiểm soát xuất khẩu vẫn then chốt

Sự tiến bộ của DeepSeek không có nghĩa là chính sách kiểm soát xuất khẩu của Mỹ thất bại, mà trái lại, chứng minh rằng nó vẫn hiệu quả. Mỹ nên tiếp tục tăng cường phong tỏa công nghệ, ngăn chặn Trung Quốc có đủ tài nguyên tính toán để vượt qua Mỹ về công nghệ AI. Trong tương lai, cạnh tranh AI sẽ không chỉ là về đổi mới kỹ thuật, mà còn là cuộc cạnh tranh về tài nguyên tính toán, và kiểm soát xuất khẩu vẫn là công cụ then chốt giúp Mỹ duy trì ưu thế công nghệ.

Cảnh báo rủi ro

Đầu tư vào tiền điện tử có rủi ro cao, giá có thể biến động mạnh, bạn có thể mất toàn bộ số vốn đầu tư. Vui lòng đánh giá cẩn thận các rủi ro.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận