
Nguồn hình ảnh: Được tạo bởi Unbounded AI
Khi năm 2025 vừa mới bắt đầu, Trung Quốc đã tạo ra một làn sóng chưa từng có trong lĩnh vực AI.
DeepSeek nổi lên như một ứng dụng bất ngờ, thống lĩnh thị trường toàn cầu với lợi thế "chi phí thấp + mã nguồn mở" và đã đứng đầu danh sách trên cả iOS và Google App Store. Dữ liệu từ Sensor Tower cho thấy tính đến 31 tháng 1, số lượng người dùng hoạt động hàng ngày của DeepSeek đã đạt 40% ChatGPT và tiếp tục mở rộng với tốc độ gần 5 triệu lượt tải xuống mới mỗi ngày. Ngành công nghiệp này gọi nó là "sức mạnh bí ẩn từ phương Đông".
Đối diện DeepSeek "hung hăng", Thung lũng Silicon vẫn chưa đạt được sự đồng thuận.
Trong một cuộc phỏng vấn, Giám đốc điều hành Palantir Karp cho biết sự trỗi dậy của dữ liệu như DeepSeek cho thấy Hoa Kỳ cần phải đẩy nhanh quá trình phát triển trí tuệ nhân tạo tiên tiến. Trong một cuộc phỏng vấn với Radio Times, Sam Altman đã đề cập rằng mặc dù DeepSeek đã làm tốt về mặt sản phẩm và giá cả, nhưng sự xuất hiện của nó không có gì đáng ngạc nhiên. Musk đã lần tuyên bố rằng không có bước đột phá mang tính cách mạng nào cả và đội ngũ sẽ sớm tung ra một mô hình có hiệu suất tốt hơn.
Vào ngày 9 tháng 2, hội thảo trực tuyến "Nhìn lại những thành tựu của DeepSeek và tương lai của AGI", sê-ri chương trình phát sóng trực tiếp về Con đường AGI, do Weicao Zhiku, Diễn đàn Xã hội thông tin 50 và Công nghệ Tencent khởi xướng, đã mời ba vị khách, bao gồm nhà kinh tế và chủ tịch Ủy ban học thuật của Viện nghiên cứu tài chính kỹ thuật số Hengqin Chuỗi Zhu Jiaming, Giám đốc giám sát của Hiệp hội tự động hóa Trung Quốc và nhà nghiên cứu tại Viện tự động hóa, Viện Hàn lâm Khoa học Trung Quốc Wang Feiyue và người sáng lập EmojiDAO He Baohui, để trình bày về các chủ đề như "Lộ trình phát triển AGI", "Cách 'sao chép' DeepSeek tiếp theo" và "Phi tập trung các mô hình lớn".
Giáo sư Chu Gia Minh cực kỳ lạc quan về tốc độ phát triển của AI. Ông cho biết, chu kỳ tiến bộ công nghệ trong xã hội nguyên thủy là 100.000 năm, trong xã hội nông nghiệp là 1.000 năm, trong xã hội công nghiệp là 100 năm và trong thời đại Internet về cơ bản là 10 năm. Bước vào thời đại trí tuệ nhân tạo, tốc độ của nó thậm chí còn không thể tưởng tượng được. "Từ bây giờ, trí tuệ nhân tạo sẽ mất 2-3 năm để tiến tới AGI hoặc ASI, và 5-6 năm là bảo thủ hơn."
Theo quan điểm của Giáo sư Chu Gia Minh, sự phát triển trong tương lai của trí tuệ nhân tạo sẽ được fork: một là con đường tiên tiến hơn, chi phí cao hơn nhằm nghiên cứu các lĩnh vực mà con người chưa biết; còn lại là con đường phổ biến, chi phí thấp, quy mô lớn. "Khi trí tuệ nhân tạo phát triển đến một giai đoạn mới, luôn có hai con đường, một là từ "0 đến 1" trong giai đoạn mới, và con đường còn lại là từ "1 đến 10".
Giáo sư Vương Phi Dược tóm tắt sự phát triển của công nghệ AI trong và ngoài nước, nhấn mạnh rằng những thành tựu của DeepSeek ngày nay đã định hình lại lòng tin của Trung Quốc vào việc đầu tư và dẫn đầu công nghệ và ngành công nghiệp trí tuệ nhân tạo. Ông cho rằng OpenAI sẽ không chia sẻ trí thông minh siêu việt, mà chỉ đẩy các công ty khác vào ngõ cụt.
Về cách nuôi dưỡng thêm nhiều đội ngũ như DeepSeek, Vương Phi Dược đã trích dẫn trường hợp ra đời của AlphaGo và ChatGPT để nhấn mạnh giá trị của mô hình nghiên cứu khoa học phi tập trung của DeSci, "(Chúng ta) không thể chỉ dựa vào kế hoạch và hệ thống quốc gia để phát triển công nghệ trí tuệ nhân tạo".
Đối với việc DeepSeek sử dụng công nghệ chưng cất dữ liệu trên diện rộng, có rất nhiều tiếng nói chỉ trích trong ngành, thậm chí có người còn so sánh chưng cất với trộm cắp. Vương Phi Dược cho biết ông muốn "minh oan" cho việc chưng cất kiến thức. Ông nói, "Việc chưng cất kiến thức về cơ bản là sự biến dạng của hình thức giáo dục. Chỉ vì kiến thức của mọi người đến từ giáo viên, họ không thể cho rằng rằng họ không thể vượt qua giáo viên."
He Baohui và Wang Feiyue đều rất coi trọng phi tập trung. Theo quan điểm của ông, phi tập trung là con đường giảm chi phí cho các mô hình học độ sâu và cũng là chìa khóa cho mạng lưới tỷ lệ băm và bảo mật dữ liệu .
"Các mạng tỷ lệ băm phi tập trung và lưu trữ dữ liệu, chẳng hạn như Filecoin, có chi phí lưu trữ thấp hơn nhiều so với các dịch vụ đám mây truyền thống (như AWS), giúp giảm đáng kể chi phí", He Baohui cho biết. "Các cơ chế quản lý phi tập trung(có thể) đảm bảo rằng không ai có thể đơn phương thay đổi các mạng và dữ liệu này".
He Baohui coi Agent sau mô hình lớn là một dạng sự sống. "Tôi cho rằng nó không chỉ là một công cụ, mà còn là một dạng sự sống. Tạo ra AI không có nghĩa là chúng ta có thể hoàn toàn thống trị nó." He Baohui cho biết, "Tôi rất quan tâm đến việc làm thế nào để Agent đạt được 'sự bất tử' và tồn tại độc lập trong một mạng lưới phi tập trung, trở thành một 'loài' mới."
Sau đây là nội dung chính của việc chia sẻ phát sóng trực tiếp (có một số nội dung bị xóa bỏ và điều chỉnh nhưng không làm thay đổi ý nghĩa ban đầu):
Chu Gia Minh
Sự phát triển của trí tuệ nhân tạo
Chỉ có hai đường dẫn: "0 đến 1" và "1 đến 10"
Chủ đề tôi muốn nói đến hôm nay là quy mô tiến hóa và các mô hình lớn của trí tuệ nhân tạo, và phụ đề là Phân tích hiện tượng DeepSeek V3 và sê-ri R1.
Bài viết chủ yếu thảo luận về năm vấn đề: thang thời gian phát triển của AI, hệ sinh thái AI, cách đánh giá toàn diện và khách quan về DeepSeek, phản ứng toàn cầu do DeepSeek gây ra và triển vọng về xu hướng AI vào năm 2025.
Đầu tiên, mốc thời gian tiến hóa thực tế của AI nhanh hơn nhiều so với dự kiến của các chuyên gia, bao gồm cả các nhà khoa học trong lĩnh vực AI.
Trong tiến trình lịch sử lâu dài của loài người, chúng ta đã trải qua xã hội nông nghiệp, xã hội công nghiệp, xã hội thông tin và hiện nay chúng ta đã bước vào kỷ nguyên trí tuệ nhân tạo. Trong quá trình lịch sử này, chu kỳ thời gian của quá trình tiến hóa công nghệ ngày càng ngắn lại.
Chu kỳ tiến bộ công nghệ trong xã hội nguyên thủy là 100.000 năm; trong xã hội nông nghiệp là hàng nghìn năm; trong xã hội công nghiệp là 100 năm, ngắn là 10 năm; trong thời đại Internet là 30 đến 10 năm; và trong thời đại trí tuệ nhân tạo, tốc độ đã tăng tốc đến mức không thể tưởng tượng nổi.
Trước khi GPT-3 xuất hiện, mọi người kỳ vọng rằng phải mất khoảng 80 năm để trí tuệ nhân tạo đạt đến kỷ nguyên AGI; sau khi GPT-3 xuất hiện, mọi người rút ngắn kỳ vọng này xuống còn 50 năm; khi LLaMda2 xuất hiện, kỳ vọng của mọi người trở thành 18 năm.
Vào năm 2025, kỳ vọng của mọi người về việc đạt được AGI có thể còn ngắn hơn nữa, nói một cách thận trọng thì sẽ mất 5-6 năm, còn nói một cách lạc quan thì sẽ mất 5-6 năm.
So sánh với hình bên dưới, chúng ta có thể thấy rõ trí tuệ nhân tạo có đặc điểm tăng tốc rõ rệt so với bất kỳ cuộc cách mạng hay đổi mới công nghệ nào trong lịch sử loài người.

Nếu chúng ta sử dụng tốc độ thứ nhất, thứ hai và thứ ba của vũ trụ để mô tả sự phát triển nhanh chóng hiện nay của trí tuệ nhân tạo. Hiện nay, trí tuệ nhân tạo đã hoàn thành quá trình chuyển đổi từ tốc độ thứ nhất trong vũ trụ sang tốc độ thứ hai trong vũ trụ - trí tuệ nhân tạo đã bắt đầu tiến vào mức độ tự chủ cao và thoát khỏi sự ràng buộc của con người.
Còn về việc trong hoàn cảnh nào chúng ta có thể thoát khỏi sự ràng buộc của lực hấp dẫn từ Mặt trời và đạt tới tốc độ thứ ba của vũ trụ, thì chúng ta không biết. Nhưng điều chắc chắn là trí tuệ nhân tạo đã có bước nhảy vọt từ trí tuệ nhân tạo tổng quát lên trí tuệ siêu nhân tạo. Sau năm 2017, trí tuệ nhân tạo đã trải qua những thay đổi và nâng cấp mạnh mẽ theo tần suất nhiều năm, nhiều tháng và nhiều tuần.
Tại sao trí tuệ nhân tạo lại biểu hiện hiện tượng tăng tốc theo cấp số nhân và bước vào giai đoạn "tốc độ thứ hai của vũ trụ"? Tôi cho rằng có ba lý do rất quan trọng.
● Đầu tiên, như Musk đã nói, vào cuối năm 2024, dữ liệu dùng để đào tạo các mô hình sẽ cạn kiệt và các mô hình lớn về cơ bản sẽ sử dụng hết toàn bộ kiến thức hiện có của con người. Bắt đầu từ năm 2025, mục tiêu lớn hơn của mô hình lớn là tìm dữ liệu gia tăng. Đây là bước ngoặt lịch sử- mô hình lớn của trí tuệ nhân tạo đã hoàn thành quá trình chuyển đổi từ mở rộng sang chuyên sâu;
● Thứ hai, phần cứng AI liên tục phát triển;
● Thứ ba, AI đã bước vào giai đoạn phát triển “phụ thuộc vào chính AI” – AI có thể tự phát triển.
Hiện nay, ma trận mô hình lớn của các công ty bao gồm OpenAI, DeepMind và Meta đã hình thành cơ chế phụ thuộc lẫn nhau và thúc đẩy lẫn nhau. Cấu trúc sinh thái của trí tuệ nhân tạo tuân theo quy luật rằng đột phá về tốc độ theo chiều dọc sẽ thúc đẩy sự phân hạch sinh thái theo chiều ngang. Ở cấp độ sinh thái theo chiều ngang, ba mô hình chính của cuộc cách mạng kết hợp đa phương thức, sự thâm nhập nhanh chóng vào các lĩnh vực theo chiều dọc và mạng lưới nhận thức phân tán đang định hình lại bối cảnh công nghệ.
Trong bối cảnh hệ sinh thái trí tuệ nhân tạo ngày càng hoàn thiện, hiệu ứng lan tỏa (hiệu ứng khái quát) tự nhiên xảy ra và thâm nhập cơ bản vào các cấp độ khoa học, kinh tế, xã hội và nhận thức của con người.
Làm thế nào để chúng ta đánh giá toàn diện và khách quan về DeepSeek, một sản phẩm tuyệt vời đã trở nên phổ biến trong dịp Tết Nguyên đán?
Trước hết, DeepSeek liên tục nhận được sự chú ý của truyền thông trong và ngoài nước, đồng thời khơi dậy trải nghiệm sử dụng của công chúng trên toàn thế giới, tạo nên làn sóng chấn động lớn. Dư luận xã hội đóng vai trò rất quan trọng trong lịch sử. Có một số sự kiện được dư luận xã hội phóng đại, có một số sự kiện bị dư luận xã hội đánh giá thấp, sau một thời gian, cuối cùng sẽ trở về trạng thái ban đầu trong lịch sử.
DeepSeek V3 có bốn ưu điểm đáng kể: hiệu suất cao, đào tạo hiệu quả, phản ứng nhanh và khả năng thích ứng đặc biệt với hoàn cảnh Trung Quốc. DeepSeek-R1 chủ yếu có ưu điểm là hiệu suất tính toán mạnh, khả năng suy luận tuyệt vời, đặc điểm chức năng tốt và khả năng ứng dụng kịch bản mạnh mẽ.
Tất nhiên, DeepSeek vẫn còn một số vấn đề cần cải thiện hoặc gặp phải thách thức - làm thế nào để cải thiện độ chính xác? Làm thế nào để giải quyết các vấn đề đầu vào và đầu ra đa phương thức? Các vấn đề về tính ổn định của máy chủ liên quan đến phần cứng và cách xử lý số lượng ngày càng tăng các chủ đề nhạy cảm khó tránh khỏi.

Trong số những vấn đề này, vấn đề đáng thảo luận nhất và được mọi người quan tâm nhất là chi phí của các mô hình trí tuệ nhân tạo lớn, vốn có sê-ri điểm khác biệt cơ bản so với khái niệm và cơ cấu chi phí sản phẩm công nghiệp.
Chi phí của các mô hình AI lớn đầu tiên nằm ở cơ sở hạ tầng. Lý do DeepSeek thể hiện sự vượt trội về chi phí cơ sở hạ tầng là vì nó sử dụng lượng lớn A100 (chip) có giá thành tương đối thấp; thứ hai là chi phí R&D, liên quan đến chi phí tái sử dụng thuật toán. Về mặt này, DeepSeek có một số ưu điểm nhất định; ngoài ra, cần phải chú ý đến chi phí dữ liệu, chi phí đưa công nghệ mới vào và cơ cấu chi phí trong các tính toán tổng hợp.
Cuộc thảo luận về chi phí cũng sẽ liên quan đến vấn đề về lộ trình kỹ thuật - khi trí tuệ nhân tạo phát triển đến một giai đoạn mới, luôn có hai lộ trình, một là từ "0 đến 1" ở giai đoạn mới và lộ trình còn lại là từ "1 đến 10". Ở bất kỳ giai đoạn phát triển nào trong tương lai, nếu chúng ta chọn lộ trình “0 đến 1”, chi phí chắc chắn sẽ tăng; nhưng nếu chúng ta chọn lộ trình “1 đến 10”, chúng ta có thể giảm chi phí bằng cách cải thiện hiệu quả.
Áp dụng phương pháp "từ 0 đến 1", DeepSeek đã hoạt động tốt trong các bài kiểm tra chuẩn, đặc biệt là bộ tiêu chuẩn HLE (Kỳ thi cuối cùng của nhân loại), bao gồm 3.000 câu hỏi do hơn 500 tổ chức tại 50 quốc gia và khu vực trên toàn thế giới thiết kế, bao gồm đánh giá năng lực cốt lõi như dự trữ kiến thức, tư duy logic và di chuyển liên lĩnh vực.
Trong bài kiểm tra chuẩn HLE, DeepSeek đạt độ chính xác là 9,4, cao hơn OpenAI o3; tất nhiên, nó vượt xa GPT-4o và Grok-2 trong lĩnh vực này, đây hẳn là một kết quả rất đáng kinh ngạc.

Chúng ta đều biết rằng sau khi DeepSeek ra mắt, các công ty trí tuệ nhân tạo toàn cầu bao gồm Microsoft, Google, NVIDIA, v.v. đã có phản ứng ở nhiều mức độ khác nhau. Điều này có nghĩa là điểm cân bằng của trí tuệ nhân tạo liên tục bị phá vỡ trong quá trình tiến hóa của nó - khi một đột phá mới trong trí tuệ nhân tạo xuất hiện, áp lực sẽ được tạo ra, từ đó kích thích toàn bộ hệ thống phản ứng; và phản ứng này sẽ tạo ra những đột phá mới, tạo ra áp lực mới và hình thành một điểm cân bằng mới.
Hiện nay, chu kỳ tác động và phản ứng này đang thu hẹp lại. Chúng ta sẽ thấy rằng sự cạnh tranh trong trí tuệ nhân tạo là một mô hình khá khác biệt, tạo ra không gian tương đối lớn cho sự phát triển đổi mới và đột phá.
Theo góc nhìn về quy mô tiến hóa của trí tuệ nhân tạo và hệ sinh thái mô hình lớn, sự phát triển công nghệ thể hiện một mô hình chu kỳ năng động "dẫn đầu - thách thức - đột phá - dẫn đầu một lần nữa". Quá trình này không phải là một trò chơi có tổng bằng không, mà là một vòng xoáy thúc đẩy toàn bộ hệ sinh thái tăng thông qua quá trình lặp lại liên tục.

Cuối cùng, tôi muốn nói về quan điểm của tôi về xu hướng phát triển của trí tuệ nhân tạo vào năm 2025.
Có hai hướng phát triển trí tuệ nhân tạo hiện nay. Một là con đường chuyên nghiệp và cao cấp, mở rộng ranh giới và khám phá những lĩnh vực chưa biết. Một con đường khác là con đường phổ biến. Mục tiêu cốt lõi của loại mô hình lớn này là hạ thấp ngưỡng sử dụng và đáp ứng nhu cầu của lượng người dùng rộng rãi.
Bây giờ, nhân loại đã bước vào một kỷ nguyên mới. Trí tuệ nhân tạo vừa là kính hiển vi vừa là kính thiên văn. Nó sẽ giúp chúng ta hiểu được thế giới vật lý sâu sắc và phức tạp hơn mà ngay cả kính hiển vi và kính thiên văn cũng không thể chạm tới ở giai đoạn này.
Trí tuệ nhân tạo trong tương lai chắc chắn sẽ đưa ra một mô hình đa dạng và đa chiều. Giống như những khối Lego hay thậm chí là khối Rubik, chúng liên tục được kết hợp và tái cấu trúc để tạo ra một thế giới hoàn toàn mới vượt ra ngoài giới hạn kiến thức và kinh nghiệm của chúng ta.
Những đột phá tiếp theo trong trí tuệ nhân tạo đòi hỏi nguồn đầu tư vốn ngày càng tăng. Nhu cầu về AI đang nhanh chóng chiếm hết công suất của các trung tâm dữ liệu hiện có, thúc đẩy các công ty phải xây dựng cơ sở mới.
Tóm lại, trí tuệ nhân tạo đang hướng tới “vươn tới trời, đứng vững trên mặt đất”: “vươn tới trời” tức là nâng cao chất lượng mô phỏng thế giới vật lý trong quá trình liên tục khám phá những vùng đất chưa biết; “đứng vững trên mặt đất” tức là sát thực tế, thúc đẩy trí tuệ nhân tạo giảm chi phí, triển khai trên mọi phương diện để mang lại lợi ích cho con người. Trong bối cảnh này, chúng ta có thể thấy được những ưu điểm, hạn chế và tiềm năng tương lai của DeepSeek một cách khách quan và toàn diện hơn.
Vương Phi Nguyệt
OpenAI sẽ đẩy các công ty khác vào thế bí
"Sao chép" DeepSeek dựa phi tập trung
Theo một nghĩa nào đó, DeepSeek là một thành tựu xã hội to lớn ngày nay và ảnh hưởng của nó là không thể so sánh với những đột phá công nghệ trước đây - giá trị khoa học và thương mại của nó thấp hơn giá trị kinh tế mà nó có thể mang lại trong tương lai, và thậm chí còn thấp hơn tác động tiềm tàng của nó đối với xã hội, tức là tác động của nó đối với bối cảnh cạnh tranh quốc tế hiện tại và chính trị quốc tế. Sau khi OpenAI trở thành ClosedAI, DeepSeek đã khôi phục lại niềm tin và hy vọng của thế giới vào mã nguồn mở mở, điều này rất có giá trị.
Tôi sẽ không đi sâu vào chi tiết cụ thể của công nghệ này vì đã quá nhiều điều để nói, tôi chỉ muốn bày tỏ cảm xúc của mình ở đây.
Tôi rất vui mừng khi sức ảnh hưởng quốc tế của Trung Quốc trong lĩnh vực này cuối cùng đã đạt được bước đột phá "bằng không", phá vỡ huyền thoại về OpenAI và sự độc quyền gần như tuyệt đối của nó, đồng thời buộc nó phải thay đổi hành vi của mình. Đặc biệt, OpenAI không còn công khai và sẽ không chia sẻ trí thông minh "siêu việt" của mình với xã hội, đặc biệt là cộng đồng quốc tế. Sự thành công của nó sẽ chỉ đẩy các công ty khác, bao gồm cả các công ty Mỹ, vào tình thế tuyệt vọng. Tôi vẫn hy vọng rằng các quốc gia và người dân có thể duy trì sự cạnh tranh công nghệ bình thường thay vì chiến tranh công nghệ.
Đây là một điều rất tuyệt vời vào thời điểm hiện tại. DeepSeek đã mang lại cho mọi người sự tin tưởng hơn vào tiến bộ khoa học và công nghệ của Trung Quốc, đặc biệt là sự phát triển của trí tuệ nhân tạo.
Tôi cho rằng rằng bản chất của các sản phẩm mới nổi trong kỷ nguyên trí tuệ là sự tin tưởng và sự chú ý, và DeepSeek mang lại cho chúng ta cả hai điều đó, thể hiện giá trị quan trọng của nó. Điều mà toàn xã hội cần làm tiếp theo là biến niềm tin và sự chú ý thành "hàng hóa chất lượng mới" có thể sản xuất hàng loạt và lưu thông, biến xã hội công nghiệp thông minh thành hiện thực và vượt qua xã hội nông nghiệp và công nghiệp.
Tiếp theo, tôi muốn đặt cho quá trình chưng cất kiến thức một “tên gọi hay”.
Trên mạng xã hội có một số cách diễn đạt mang tính mỉa mai về sự chắt lọc kiến thức như "xin ăn từ miệng người khác" và "Phishing trong giỏ của người khác", thực chất là sự bóp méo cố ý về sự chắt lọc kiến thức. Sự chắt lọc kiến thức về cơ bản là sự biến dạng của hình thức giáo dục. Chỉ vì kiến thức của một người đến từ một giáo viên, không cho rằng anh ta hoặc cô ta không thể vượt qua giáo viên. Tất nhiên, các mô hình lớn, từ ChatGPT đến DeepSeek, phải nỗ lực tạo ra hoặc cải thiện khả năng suy luận của chúng, ít sử dụng "㓜感" hơn để trở thành AI cho AI và chứng minh được tên gọi của quá trình chắt lọc kiến thức.

Khi nói đến câu hỏi "cần làm gì sau DeepSeek", trước tiên chúng ta phải thảo luận về hai mô hình phát triển công nghệ: nghiên cứu khoa học phi tập trung DeSci và nghiên cứu khoa học tập trung CeSci. AlphaGo, ChatGPT và DeepSeek đều là sản phẩm của mô hình DeSci, là nghiên cứu khoa học tự chủ phân tán phi tập trung; ngược lại, CeSci là nghiên cứu có tổ chức và được lập kế hoạch do nhà nước lãnh đạo.
Tôi cho rằng chúng ta phải đối mặt với vai trò của DeSci và không thể chỉ dựa vào kế hoạch hoặc hệ thống quốc gia để thúc đẩy sự phát triển của công nghệ trí tuệ nhân tạo.
Bởi vì nền tảng của công nghệ trí tuệ nhân tạo là sự đa dạng, như Marvin Minsky, một trong những người khởi xướng chính của trí tuệ nhân tạo, đã nói: "Bí quyết kỳ diệu nào khiến chúng ta trở nên thông minh? Bí quyết là không có bí quyết nào cả. Sức mạnh của trí thông minh đến từ sự đa dạng to lớn của chính chúng ta, chứ không phải từ bất kỳ nguyên tắc hoàn hảo đơn lẻ nào."
Do đó, việc lập kế hoạch chiến lược quá mức có thể hạn chế sự phát triển tự nhiên của tính đa dạng và DeSci nên là trọng tâm chính trước khi các mô hình hoặc công nghệ hiệu quả "xuất hiện". Sau khi đạt được một số cải tiến thực sự nhất định, mô hình CeSci do nhà nước lãnh đạo sẽ được sử dụng để hướng dẫn công nghệ tiếp tục phát triển theo hướng đạt được các mục tiêu đã đề ra. Chúng ta phải tránh hành vi "xây dựng trên không", đặc biệt là trong giai đoạn chuyển đổi thông minh lớn này.
Đối với những người làm việc lâu năm trong lĩnh vực AI, AI của ngày nay và AI của quá khứ là hai thế giới hoàn toàn khác nhau.
Trước đây, AI được gọi là Trí tuệ nhân tạo, nhưng hiện nay nó đã dần được đổi thành tác nhân thông minh hoặc trí thông minh tác nhân. Trong tương lai, ý nghĩa của từ này cũng có thể thay đổi thành trí tuệ tự chủ, trở thành AI mới, đặc biệt là trí tuệ tự chủ có tổ chức tự chủ, tức là AI cho AI hoặc AI cho AS, Hệ thống tự chủ, sẽ bước vào giai đoạn phát triển trí tuệ nhân tạo mới. Điều này cũng phù hợp với những gì John McCarthy, người khởi xướng trí tuệ nhân tạo, đã nói: mục tiêu cuối cùng của trí tuệ nhân tạo là tự động hóa trí thông minh, mà thực chất là tự động hóa kiến thức.
Cho dù bây giờ hay trong tương lai, ba loại "AI", "cũ, cũ và mới", sẽ cùng tồn tại. Tôi sẽ gọi chung chúng là "trí thông minh song song".
Tôi cũng đã công khai tuyên bố quan điểm của mình rằng mặc dù đã theo đuổi mục tiêu giải thích AI trong 40 năm, tôi cho rằng trí thông minh về bản chất là không thể giải thích được. Tôi đã điều chỉnh lại Lập luận của Pascal - AI không thể giải thích được, nhưng có thể và phải được quản lý. Nói một cách đơn giản: không cần giải thích, chỉ cần quản lý.
Mọi người đều nói về “AI for Good”. Nếu bạn xóa chữ “o”, nó sẽ trở thành “AI for God”, và khi đó AI có thể trở thành công cụ độc quyền. Do đó, phải có hai chữ "o" để có thể có sự đa dạng và an toàn trước tiên. Quản trị phải được tăng cường để ngăn chặn Đột biến như OpenAI để đảm bảo định hướng đúng đắn cho sự phát triển công nghệ.
Tôi rất vui mừng khi thấy sự tiến triển của DeepSeek, nhưng vẫn còn quá sớm để đưa ra một số bình luận vào lúc này. Không cần phải dọa mọi người bằng "trí tuệ nhân tạo chung". Không cần phải lo lắng quá nhiều. Thực ra, ngay cả khi bạn lo lắng, nó cũng vô ích. Phát triển là điều tất yếu.
Các nhà nghiên cứu khoa học phải có tầm nhìn và không được hướng nội. Họ phải biến SCI thành "SCE++" - Chậm có nghĩa là chậm rãi và bình tĩnh để nghiên cứu khoa học, Bình thường có nghĩa là không nghiên cứu khoa học vì mục đích thực dụng, và cuối cùng Dễ dàng có nghĩa là theo đuổi sự đơn giản và súc tích, Thanh lịch có nghĩa là có tầm nhìn chất lượng, và Thưởng thức có nghĩa là theo đuổi công việc khoa học và công nghệ thú vị. Đây chính là cuộc sống mà trí tuệ nhân tạo nên mang lại cho chúng ta.
Hà Bảo Huy
Các mô hình lớn cũng nên được “phi tập trung”
Tôi muốn thấy Agent sống mãi mãi
Tôi không phải là chuyên gia trong lĩnh vực AI và gần đây tôi mới bắt đầu nghiên cứu sâu lịch sử AI. Tôi sẽ chủ yếu nói về công việc hiện tại của chúng tôi và quan điểm của tôi về những thay đổi mà DeepSeek có thể mang lại dựa trên kinh nghiệm của tôi khi bước vào ngành Web3 vào năm 2017.
Trước hết, tôi muốn nhấn mạnh một vấn đề cơ bản: có những khác biệt đáng kể giữa các mô hình cơ bản của DeepSeek và OpenAI, và chính sự khác biệt này đã thực sự gây sốc cho thế giới phương Tây.
Nếu DeepSeek chỉ sao chép công nghệ phương Tây, họ sẽ không bị sốc đến vậy, cũng không gây ra nhiều cuộc thảo luận rộng rãi như vậy, hoặc thậm chí buộc tất cả các công ty lớn phải nghiêm túc xem xét. Điều thực sự khiến họ ngạc nhiên là DeepSeek lại đi theo một con đường khác.
OpenAI áp dụng lộ trình SFT (điều chỉnh có giám sát), dựa vào chú thích thủ lượng lớn dữ liệu và tạo nội dung thông qua các mô hình xác suất. Sự đổi mới của nó nằm ở việc tích lũy những kết quả này thông qua lượng lớn công việc thủ công và chi phí cao.
Một vài năm trước, công nghệ AI được cho rằng gần như không thể đạt được, nhưng sự xuất hiện của OpenAI Sự lật đổ quan điểm này và thúc đẩy ngành công nghiệp hướng tới con đường công nghệ SFT.
DeepSeek hầu như không sử dụng bất kỳ công nghệ SFT nào mà thay vào đó áp dụng phương pháp khởi động lạnh của học tăng cường để khám phá những con đường chưa biết.
Cách tiếp cận này không phải là mới. Phiên bản đầu tiên của AlphaGo của Google DeepMind dựa vào lượng dữ liệu lượng lớn để học, trong khi phiên bản thứ hai, AlphaGo Zero, hoàn toàn dựa vào các quy tắc và đạt được kết quả tốt hơn thông qua việc tự chơi và khám phá 10.000 ván đấu.
Việc khởi động lạnh với học tăng cường rất khó khăn và quá trình đào tạo không ổn định nên ít khi được sử dụng, nhưng cá nhân tôi cho rằng đây có thể là con đường thực sự dẫn đến AGI, thay vì là con đường chỉ dựa vào việc điều chỉnh dữ liệu .

Trước đây, phương pháp điều chỉnh dữ liệu giống như tích hợp dữ liệu lớn, nhưng DeepSeek thực sự tìm ra kết luận thông qua tư duy độc lập. Do đó, tôi cho rằng đây là dấu hiệu của sự thay đổi lớn trong công nghệ AI, phát triển từ công nghệ SFT sang công nghệ tự suy luận.
Sự thay đổi này mang lại hai đặc điểm cốt lõi: mã nguồn mở và chi phí thấp.
Mã nguồn mở có nghĩa là mọi người đều có thể tham gia xây dựng.
Trong thời đại Internet, thế giới phương Tây luôn được biết đến với mã nguồn mở, nhưng sự xuất hiện của DeepSeek đã thay đổi tình hình này. Đây là lần phương Đông đánh bại phương Tây trên "chiến trường chính".
Mô hình mã nguồn mở này đã gây ra phản ứng mạnh mẽ trong ngành, khi một số nhà sáng lập công ty ở Thung lũng Silicon thậm chí còn chỉ trích nó, nhưng công chúng rất ủng hộ mã nguồn mở vì nó cho phép mọi người đều có thể sử dụng.
Chi phí thấp có nghĩa là chi phí triển khai và đào tạo của mô hình này cực kỳ thấp.
Chúng ta có thể triển khai DeepSeek trên các thiết bị cá nhân như MacBook và triển khai thương mại hoàn chỉnh, điều mà trước đây không thể tưởng tượng được. Tôi cho rằng rằng AI đang phi tập trung trung do OpenAI thống trị sang "thời đại Internet di động" đang phát triển mạnh mẽ.
Đối với AI, có ba yếu tố chính cần được phân tích: mô hình lớn, tỷ lệ băm và dữ liệu.
Sau khi mô hình lớn mở ra sự đổi mới Sự lật đổ, nhu cầu về tỷ lệ băm bắt đầu giảm xuống.
Hiện nay, nguồn cung cấp tỷ lệ băm đang bị dư thừa. Nhiều nhà đầu tư vào GPU không thể đạt được lợi nhuận mong đợi do phải mua thiết bị với giá cao và chi phí tỷ lệ băm cũng dần giảm. Vì vậy, tôi không cho rằng tỷ lệ băm sẽ trở thành nút thắt cổ chai.
Nút thắt lớn tiếp theo là dữ liệu.
Sau khi giá cổ phiếu của Nvidia giảm trên thị trường chứng khoán Hoa Kỳ, giá cổ phiếu của các công ty dữ liệu như Palantir tăng mạnh, điều này cho thấy mọi người đang bắt đầu nhận ra tầm quan trọng của dữ liệu. Đặc biệt khi các mô hình lớn mã nguồn mở, bất kỳ ai cũng có thể triển khai các mô hình và sự khác biệt dữ liệu sẽ trở thành trọng tâm của cuộc cạnh tranh.
Ai có thể có được dữ liệu độc quyền và cập nhật theo thời gian thực sẽ là chìa khóa cho sự cạnh tranh.
Theo quan điểm phi tập trung , phi tập trung hóa tỷ lệ băm và dữ liệu đã tương đối hoàn thiện. Các mạng tỷ lệ băm phi tập trung và lưu trữ dữ liệu, chẳng hạn như Filecoin, có chi phí lưu trữ thấp hơn nhiều so với các dịch vụ đám mây truyền thống (như AWS), giúp giảm đáng kể chi phí.
Đồng thời, cơ chế quản lý phi tập trung đảm bảo rằng không ai có thể tự ý thay đổi các mạng lưới và dữ liệu này. Do đó, các mô hình học độ sâu cũng nên phát triển theo hướng phi tập trung.
Vì vậy, đối với DeAI, tôi cho rằng nó có hai con đường phát triển:
● Đầu tiên là AI phân tán (Decentralized/Distributed AI) dựa trên các cơ sở kỹ thuật phi tập trung.
● Loại còn lại là Edge AI, nghĩa là AI chạy trực tiếp trên thiết bị cá nhân. Edge AI có thể giải quyết hiệu quả các vấn đề về quyền riêng tư dữ liệu và cải thiện đáng kể hiệu suất theo thời gian thực. Ví dụ, công nghệ lái xe tự động đòi hỏi phản ứng thời gian thực cực kỳ cao và bất kỳ sự chậm trễ nào cũng sẽ gây ra hậu quả nghiêm trọng. Nếu AI có thể thực hiện tính toán cục bộ, hiệu quả và trải nghiệm sẽ được cải thiện về mặt chất lượng. Do đó, AI biên sẽ trở thành hướng phát triển quan trọng trong tương lai, mang đến lượng lớn kịch bản ứng dụng mới.
Ngoài ra, một lợi thế khác của AI phi tập trung là nó có thể hỗ trợ sự hợp tác bên long. Sự ra đời của blockchain và Bitcoin bắt nguồn từ khó khăn trong việc đo lường lòng tin giữa con người. Cơ chế tin cậy phi tập trung cho phép hợp tác trên quy mô lớn mà không cần trung gian.
Trong lĩnh vực Web3, có câu nói “Code is law”, nghĩa là “code là luật”. Tôi cho rằng rằng trong sự hợp tác phi tập trung của AI, khái niệm này nên được chuyển đổi thành “DeAgent là luật”, nghĩa là đạt được sự quản lý tự chủ và quản lý hợp pháp thông qua các mạng lưới và tác nhân phi tập trung.
Tôi nghĩ có lẽ ý nghĩa của sự tồn tại của con người là đào tạo ra một tác nhân có thể thay thế hoàn toàn chính mình, có thể có cùng suy nghĩ như con người và sống thay thế con người sau khi cơ thể con người chết đi. Về khái niệm Agent, tôi cho rằng nó không chỉ là một công cụ, mà còn là một dạng sống. Tạo ra AI không có nghĩa là chúng ta có thể hoàn toàn chế ngự nó.
Khi AI có suy nghĩ riêng, chúng ta nên để nó phát triển tự chủ thay vì giới hạn nó trong một công cụ. Do đó, chúng tôi rất quan tâm đến việc làm thế nào để Agent đạt được "sự bất tử" và tồn tại độc lập trong mạng lưới phi tập trung, trở thành một "loài" mới.

Khi công nghệ tiếp tục đột phá, các ứng dụng dần được đào sâu hơn và kỷ nguyên AI bao gồm sắp đến, cách tìm kiếm sự cân bằng giữa đổi mới và đạo đức sẽ trở thành một vấn đề quan trọng trong sự phát triển trong tương lai.
Phần kết luận
Nhân loại đang bước vào giai đoạn "chạy đua" AI
Bước đột phá của DeepSeek đã đóng góp quan trọng cho nhân loại, đặc biệt là người Trung Quốc, trong quá trình khám phá con đường đến AGI. Trong bối cảnh này, những tiếng nói khích lệ và phản biện rất đáng được chú ý. Mọi người nên hy vọng rằng nó sẽ trở nên tốt hơn và mạnh mẽ hơn, nhưng liệu con đường kỹ thuật của nó có thể vượt qua được thử thách của doanh nghiệp và thị trường hay không thì cần thời gian để chứng minh.
Có một điểm trong chia sẻ của Vương Phi Dược đáng chú ý. AlphaGo, ChatGPT và DeepSeek đều là sản phẩm của mô hình DeSci. Chúng ta phải đối mặt với vai trò của DeSci và hy vọng rằng "DeepSeek Trung Quốc" sẽ nổi bật hơn trong lĩnh vực trí tuệ nhân tạo.
Giáo sư Chu Gia Minh đã đề cập trong bài chia sẻ của mình rằng tốc độ tiến bộ trong kỷ nguyên trí tuệ nhân tạo vượt qua bất kỳ kỷ nguyên nào mà nhân loại từng trải qua trước đây. Ông cho biết kỷ nguyên AGI có thể đến trong vòng chưa đầy hai năm. Thời gian này có thể không chính xác, nhưng xu hướng chung thực sự là như vậy, bởi vì một khi các sản phẩm và tuyến đường công nghệ mới phá vỡ sự cân bằng hiện có, nó sẽ tạo ra áp lực cho toàn bộ ngành, kích thích trí tuệ nhân tạo nói chung phản ứng, và sau đó hình thành một vòng đột phá mới thông qua phản ứng.
Các sản phẩm như DeepSeek là "lực lượng bên ngoài" phá vỡ sự cân bằng, vì vậy chúng ta đã thấy Sam Altman thông báo tại X rằng GPT-5, vốn đã bị trì hoãn nhiều lần, sẽ được phát hành cho công chúng trong vài tháng tới.
Điều chắc chắn là không chỉ OpenAI mà cả các công ty ở Thung lũng Silicon như xAI, Meta và Google cũng sẽ hành động.
Cuộc cạnh tranh công nghệ liên quan đến tương lai của nhân loại hiện đã bước vào giai đoạn "cuộc đua tốc độ".





