Ghi chú của biên tập viên: Các phòng thí nghiệm AI của Trung Quốc đang ngày càng trở thành một thế lực không thể phủ nhận trong cuộc cạnh tranh toàn cầu về các mô hình AI quy mô lớn. Ưu điểm của họ không chỉ đến từ nguồn nhân lực dồi dào, năng lực kỹ thuật mạnh mẽ và khả năng cải tiến nhanh chóng, mà còn từ một cách tiếp cận tổ chức rất thực tế: ít bàn luận về khái niệm, tập trung nhiều hơn vào xây dựng mô hình; ít chú trọng vào các cá nhân xuất sắc, tập trung nhiều hơn vào khả năng thực hiện đội ngũ; ít phụ thuộc vào các dịch vụ bên ngoài và ưu tiên tự mình nắm vững bộ công nghệ cốt lõi.
Sau khi đến thăm một số phòng thí nghiệm trí tuệ nhân tạo hàng đầu ở Trung Quốc, tác giả Nathan Lambert nhận thấy rằng hệ sinh thái trí tuệ nhân tạo ở Trung Quốc không hoàn toàn giống với ở Hoa Kỳ. Hoa Kỳ chú trọng hơn vào các mô hình độc đáo, đầu tư vốn và tầm ảnh hưởng cá nhân của các nhà khoa học hàng đầu; trong khi đó, Trung Quốc lại xuất sắc trong việc nhanh chóng bắt kịp các lĩnh vực hiện có, nhanh chóng đưa khả năng của các mô hình lên hàng đầu thông qua mã nguồn mở, tối ưu hóa kỹ thuật và đầu tư của lượng lớn các nhà nghiên cứu trẻ.
Điểm đáng chú ý nhất không phải là liệu trí tuệ nhân tạo của Trung Quốc đã vượt qua trí tuệ nhân tạo của Hoa Kỳ hay chưa, mà là hai con đường phát triển khác nhau đang nổi lên: Hoa Kỳ giống một cuộc cạnh tranh tiên tiến dựa trên vốn đầu tư và các phòng thí nghiệm hàng đầu, trong khi Trung Quốc giống một cuộc cạnh tranh công nghiệp dựa trên năng lực kỹ thuật, hệ sinh thái mã nguồn mở và khả năng tự chủ công nghệ.
Điều này có nghĩa là cuộc cạnh tranh về trí tuệ nhân tạo trong tương lai sẽ không chỉ là cuộc chiến xếp hạng mô hình, mà còn là cuộc cạnh tranh về năng lực tổ chức, hệ sinh thái nhà phát triển và khả năng thực thi trong ngành. Sự thay đổi thực sự trong lĩnh vực trí tuệ nhân tạo của Trung Quốc là nó không còn đơn thuần sao chép Thung lũng Silicon, mà đang tham gia vào hàng đầu toàn cầu theo cách riêng của mình.
Sau đây là văn bản gốc:
Ngồi trên chuyến tàu cao tốc mới từ Hàng Châu đến Thượng Hải, tôi nhìn ra ngoài cửa sổ và thấy những dãy núi nhấp nhô điểm xuyết những tua bin gió, bóng dáng chúng in hằn trên nền hoàng hôn. Những ngọn núi tạo thành bối cảnh, trong khi trước mắt tôi là những cánh đồng rộng lớn xen kẽ với những cụm nhà cao tầng.
Tôi trở về từ Trung Quốc với lòng khiêm nhường tột cùng. Được đón tiếp nồng hậu ở một nơi xa lạ như vậy thực sự là một trải nghiệm ấm lòng và đầy tính nhân văn. Tôi đã có vinh dự được gặp gỡ nhiều người trong hệ sinh thái AI – những người mà trước đây tôi chỉ biết đến từ xa; nụ cười rạng rỡ và sự nhiệt tình của họ một lần nữa nhắc nhở tôi rằng công việc của tôi, và toàn bộ hệ sinh thái AI, đều tính toàn cầu.
Tư duy của các nhà nghiên cứu Trung Quốc
Các công ty Trung Quốc xây dựng mô hình ngôn ngữ rất phù hợp để trở thành những "người theo kịp nhanh chóng" công nghệ này. Họ xây dựng dựa trên truyền thống lâu đời về giáo dục và văn hóa làm việc của Trung Quốc, đồng thời áp dụng một cách tiếp cận hơi khác so với phương Tây trong việc xây dựng các công ty công nghệ.
Nếu chỉ nhìn vào kết quả đầu ra—các mô hình mới nhất và lớn nhất, cùng các quy trình làm việc dựa trên tác nhân mà chúng hỗ trợ—và sau đó là các yếu tố đầu vào—như các nhà khoa học hàng đầu, lượng dữ liệu khổng lồ và tài nguyên tính toán tốc độ cao—thì các phòng thí nghiệm của Trung Quốc và Mỹ dường như khá giống nhau. Sự khác biệt thực sự, lâu dài nằm ở cách thức tổ chức và định hình các yếu tố này.
Tôi luôn cho rằng rằng một trong những lý do các phòng thí nghiệm Trung Quốc giỏi bắt kịp và luôn giữ vị trí dẫn đầu là vì văn hóa của họ rất phù hợp với nhiệm vụ này. Nhưng nếu chưa trực tiếp nói chuyện với mọi người, tôi không cảm thấy thoải mái khi cho rằng trực giác này xuất phát từ một ảnh hưởng đáng kể nào. Sau khi trò chuyện với nhiều nhà khoa học xuất sắc, khiêm tốn và cởi mở tại các phòng thí nghiệm hàng đầu của Trung Quốc, nhiều suy nghĩ của tôi đã trở nên rõ ràng hơn.
Việc xây dựng các mô hình ngôn ngữ quy mô lớn tốt nhất hiện nay phụ thuộc phần lớn vào công việc tỉ mỉ trên toàn bộ hệ thống công nghệ: từ dữ liệu và chi tiết kiến trúc đến việc triển khai các thuật toán học tăng cường. Mỗi phần của mô hình đều có tiềm năng cải thiện hiệu suất, và việc kết hợp những cải tiến này là một quá trình phức tạp. Trong quá trình này, công việc của một số cá nhân xuất sắc có thể phải tạm dừng để tối đa hóa hiệu suất tổng thể của mô hình trong tối ưu hóa đa mục tiêu.
Các nhà nghiên cứu người Mỹ rõ ràng cũng rất giỏi trong việc giải quyết các vấn đề liên quan đến các thành phần riêng lẻ, nhưng Mỹ có văn hóa "tự bảo vệ quyền lợi bản thân" mạnh mẽ hơn. Là một nhà khoa học, bạn thường thành công hơn khi chủ động tìm kiếm sự chú ý cho công việc của mình; và văn hóa đương đại cũng đang thúc đẩy một con đường mới dẫn đến danh vọng: trở thành "nhà khoa học AI hàng đầu". Điều này tạo ra mâu thuẫn trực tiếp.
Có tin đồn lan rộng rằng tổ chức Llama đã sụp đổ dưới áp lực chính trị sau khi những lợi ích này bị lồng ghép vào một cấu trúc phân cấp. Tôi cũng nghe từ các phòng thí nghiệm khác rằng đôi khi cần phải "xoa dịu" một nhà nghiên cứu hàng đầu và khiến họ ngừng phàn nàn rằng ý tưởng của họ không được đưa vào mô hình cuối cùng. Cho dù điều này có hoàn toàn đúng hay không, điểm mấu chốt là rõ ràng: sự tự nhận thức và mong muốn thăng tiến trong sự nghiệp thực sự có thể cản trở mọi người xây dựng những mô hình tốt nhất. Ngay cả một sự khác biệt văn hóa nhỏ, mang tính định hướng như vậy giữa Mỹ và Trung Quốc cũng có thể tác động đáng kể đến kết quả cuối cùng.
Một trong đó sự khác biệt liên quan đến việc ai ở Trung Quốc thực sự đang xây dựng các mô hình này. Một thực tế rõ ràng ở tất cả các phòng thí nghiệm là phần lớn những người đóng góp cốt lõi vẫn là sinh viên. Các phòng thí nghiệm này còn khá non trẻ, điều này làm tôi nhớ đến cấu trúc tổ chức của chúng ta tại Ai2: sinh viên được đối xử như những người đồng nghiệp và được trực tiếp hòa nhập vào đội ngũ mô hình ngôn ngữ lớn.
Điều này rất khác so với các phòng thí nghiệm hàng đầu ở Mỹ. Tại Mỹ, các công ty như OpenAI, Anthropic và Cursor hoàn toàn không cung cấp chương trình thực tập. Các công ty khác như Google có thể trên danh nghĩa cung cấp các chương trình thực tập liên quan đến Gemini , nhưng nhiều người lo ngại rằng các chương trình thực tập của họ có thể bị tách rời khỏi công việc cốt lõi thực sự.
Tóm lại, những khác biệt văn hóa nhỏ này có thể nâng cao khả năng xây dựng mô hình theo những cách sau: mọi người sẵn sàng làm những công việc ít hào nhoáng hơn để cải thiện mô hình cuối cùng; những người mới tham gia phát triển AI có thể ít bị ảnh hưởng bởi các chu kỳ cường điệu về AI trước đây và do đó thích nghi nhanh hơn với phương pháp công nghệ hiện đại mới. Trên thực tế, một nhà khoa học Trung Quốc mà tôi đã nói chuyện đã coi đây là một lợi thế; sự tự nhận thức thấp hơn giúp các cấu trúc tổ chức dễ mở rộng hơn ở một mức độ nào đó vì mọi người ít có khả năng cố gắng "lách luật"; lượng lớn nhân tài rất phù hợp để giải quyết các vấn đề đã có bằng chứng về tính khả thi ở nơi khác, v.v.
Xu hướng xây dựng các mô hình ngôn ngữ đương đại này trái ngược với một cho rằng phổ biến: rằng các nhà nghiên cứu Trung Quốc ít thực hiện các nghiên cứu học thuật sáng tạo, đột phá theo kiểu "từ con số 0 đến 1".
Trong lần chuyến thăm phòng thí nghiệm học thuật khác trong chuyến đi lần , nhiều nhà lãnh đạo đã đề cập đến việc họ đang nuôi dưỡng một nền văn hóa nghiên cứu tham vọng hơn. Đồng thời, một số nhà lãnh đạo kỹ thuật mà chúng tôi đã nói chuyện lại nghi ngờ liệu việc định hình lại các phương pháp nghiên cứu khoa học này có khả thi trong ngắn hạn hay không, vì nó đòi hỏi phải thiết kế lại hoàn toàn hệ thống giáo dục và khích lệ, một sự chuyển đổi quá lớn để có thể thực hiện được trong điều kiện kinh tế hiện nay.
Nền văn hóa này dường như đang đào tạo một nhóm sinh viên và kỹ sư có kỹ năng rất cao trong "các trò chơi xây dựng mô hình ngôn ngữ quy mô lớn". Và tất nhiên, số lượng của họ cực kỳ đông đảo.
Những sinh viên này nói với tôi rằng Trung Quốc đang trải qua hiện tượng chảy máu chất xám tương tự như ở Hoa Kỳ: nhiều người trước đây từng cân nhắc theo đuổi sự nghiệp học thuật giờ đây lại có kế hoạch ở lại làm việc trong ngành công nghiệp. Trong đó những nhận xét thú vị nhất đến từ một nhà nghiên cứu, người ban đầu muốn trở thành giáo sư. Anh ấy nói rằng anh ấy muốn trở thành giáo sư vì muốn gần gũi hơn với hệ thống giáo dục; nhưng sau đó anh ấy nhận xét rằng vấn đề giáo dục đã được giải quyết bằng mô hình ngôn ngữ lớn – "Tại sao sinh viên vẫn phải đến nói chuyện với tôi nữa!"
Việc sinh viên bước vào lĩnh vực mô hình ngôn ngữ quy mô lớn với những góc nhìn mới mẻ là một lợi thế. Trong vài năm qua, chúng ta đã chứng kiến những sự thay đổi mô hình quan trọng trong các mô hình ngôn ngữ quy mô lớn: từ mở rộng MoE đến mở rộng học tăng cường, và sau đó là hỗ trợ các tác nhân thông minh. Để làm tốt bất kỳ điều nào trong số này đều đòi hỏi khả năng tiếp thu cực kỳ nhanh chóng lượng lớn thông tin bối cảnh, bao gồm cả các tài liệu rộng hơn và hệ thống công nghệ trong chính công ty của mình.
Sinh viên đã quen với việc này và sẵn lòng khiêm tốn gạt bỏ mọi định kiến về "điều gì nên hiệu quả". Họ lao vào công việc một cách hết mình, cống hiến cả cuộc đời trong đó, chỉ để có cơ hội cải thiện mô hình.
Những sinh viên này cũng rất thẳng thắn, không hề sa đà vào những chi tiết triết học rườm rà có thể làm các nhà khoa học xao nhãng. Khi tôi hỏi họ ứng xử quan điểm đối với những tác động kinh tế hoặc rủi ro xã hội dài hạn của các mô hình mà họ xây dựng, số lượng các nhà nghiên cứu Trung Quốc có quan điểm phức tạp và mong muốn gây ảnh hưởng đến những vấn đề này lại ít hơn đáng kể. Họ chỉ cho rằng nhân vật của mình đơn giản là xây dựng những mô hình tốt nhất có thể.
Sự khác biệt này rất nhỏ và dễ bị bỏ qua. Nhưng nó dễ nhận thấy nhất khi bạn có một cuộc trò chuyện dài với một nhà nghiên cứu thanh lịch, thông minh, người có thể nói tiếng Anh trôi chảy: khi bạn hỏi những câu hỏi mang tính triết học hơn về trí tuệ nhân tạo, những câu hỏi cơ bản này lại lơ lửng trong không khí, và người kia thể hiện sự bối rối đơn giản. Đối với họ, đó là một sai lầm về mặt nhận thức.
Một nhà nghiên cứu thậm chí còn trích dẫn nhận xét nổi tiếng của Dan Wang: so với Hoa Kỳ, nơi luật sư chiếm ưu thế, Trung Quốc được điều hành bởi các kỹ sư. Ông đã sử dụng phép so sánh này để nhấn mạnh khát vọng phát triển của họ khi thảo luận về những vấn đề này. Ở Trung Quốc, không có con đường bài bản nào để bồi dưỡng sức ảnh hưởng của các nhà khoa học Trung Quốc, không giống như các podcast phổ biến như của Dwarkesh hay Lex.
Tôi đã cố gắng thuyết phục các nhà khoa học Trung Quốc bình luận về những bất ổn kinh tế do AI gây ra, những vấn đề vượt qua khả năng đơn giản của AGI, hoặc những cuộc tranh luận về đạo đức xoay quanh cách thức hoạt động của các mô hình; những câu hỏi này cuối cùng đã hé lộ bối cảnh bối cảnh và trình độ học vấn của các nhà khoa học này (đã chỉnh sửa 1). Họ cực kỳ tập trung vào công việc của mình, nhưng họ lớn lên trong một hệ thống không khuyến khích thảo luận và bày tỏ quan điểm về cách thức tổ chức xã hội và sự thay đổi của nó.
Nhìn từ góc độ rộng hơn, đặc biệt là Bắc Kinh, cảm giác rất giống khu vực Vịnh San Francisco: một phòng thí nghiệm cạnh tranh có thể chỉ cách đó vài phút đi bộ hoặc đi taxi. Sau khi hạ cánh, tôi đã ghé thăm khuôn viên của Alibaba tại Bắc Kinh trên đường đến khách sạn. Trong 36 giờ tiếp theo, chúng tôi đã đến thăm Zhipu AI, Lunar Dark Side, Đại học Thanh Hoa, Meituan, Xiaomi và 01.ai.
Việc sử dụng Didi Chuxing (ứng dụng gọi xe) rất tiện lợi ở Trung Quốc. Nếu bạn chọn phiên bản XL, bạn thường sẽ được bố trí một chiếc xe van điện nhỏ có ghế massage. Chúng tôi đã hỏi các nhà nghiên cứu về cuộc chiến giành nhân tài, và họ nói rằng nó rất giống với những gì chúng tôi trải nghiệm ở Mỹ. Các nhà nghiên cứu thường xuyên thay đổi công việc, và việc họ chọn đến đâu phần lớn phụ thuộc vào nơi nào có môi trường làm việc tốt nhất vào thời điểm đó.
Ở Trung Quốc, cộng đồng mô hình ngôn ngữ lớn mạnh giống một hệ sinh thái hơn là một phe phái đối đầu. Trong nhiều cuộc trò chuyện riêng tư, tôi hầu như chỉ nghe thấy sự tôn trọng lẫn nhau. Tất cả các phòng thí nghiệm Trung Quốc đều cảnh giác với ByteDance và mô hình Doubao phổ biến của họ, vì đây là phòng thí nghiệm mã nguồn đóng tiên tiến duy nhất ở Trung Quốc. Trong khi đó, tất cả các phòng thí nghiệm đều rất tôn trọng DeepSeek, cho rằng đây là phòng thí nghiệm am hiểu nghiên cứu nhất ở cấp điều hành. Ở Mỹ, những cuộc trò chuyện riêng tư với các thành viên phòng thí nghiệm thường dễ dẫn đến xung đột.
Điều khiến tôi ấn tượng nhất về sự khiêm tốn của các nhà nghiên cứu Trung Quốc là xu hướng gạt bỏ các vấn đề kinh doanh, nói rằng đó không phải là việc của họ. Ngược lại, ở Mỹ, mọi người dường như đều say mê các xu hướng ngành khác nhau trong các hệ sinh thái khác nhau, từ các nhà cung cấp dữ liệu đến tỷ lệ băm và tài chính.
Những điểm khác biệt và tương đồng giữa ngành công nghiệp trí tuệ nhân tạo của Trung Quốc và các phòng thí nghiệm phương Tây.
Điều khiến việc xây dựng mô hình AI trở nên thú vị ngày nay là nó không còn chỉ đơn thuần là việc tập hợp một nhóm các nhà nghiên cứu xuất sắc trong một tòa nhà để tạo ra một kỳ tích kỹ thuật. Điều đó chắc chắn phổ biến hơn trong quá khứ, nhưng để duy trì việc kinh doanh AI, các mô hình ngôn ngữ quy mô lớn đang trở thành một mô hình lai: nó bao gồm việc xây dựng, triển khai, tài trợ và thúc đẩy việc áp dụng sản phẩm đó.
Các công ty AI hàng đầu hoạt động trong các hệ sinh thái phức tạp. Những hệ sinh thái này cung cấp nguồn vốn, tỷ lệ băm, dữ liệu và nhiều yếu tố khác để liên tục thúc đẩy sự phát triển tiên tiến.
Trong hệ sinh thái phương Tây, việc tích hợp các yếu tố đầu vào cần thiết để tạo ra và duy trì các mô hình ngôn ngữ quy mô lớn đã được khái niệm hóa và lập bản đồ khá tốt. Anthropic và OpenAI là những ví dụ điển hình. Do đó, nếu chúng ta có thể tìm thấy những khác biệt đáng kể trong cách các phòng thí nghiệm Trung Quốc suy nghĩ về những vấn đề này, chúng ta có thể thấy những khác biệt có ý nghĩa mà các công ty khác nhau có thể đang đặt cược vào trong tương lai. Tất nhiên, những tương lai này cũng sẽ bị ảnh hưởng mạnh mẽ bởi các hạn chế về nguồn vốn và/hoặc tỷ lệ băm.
Tôi đã tóm tắt những điểm chính quan trọng nhất từ các cuộc trao đổi với các phòng thí nghiệm này ở "cấp độ ngành công nghiệp AI" như sau:
Thứ nhất, đã có những dấu hiệu ban đầu cho thấy nhu cầu trong nước đối với trí tuệ nhân tạo.
Một giả thuyết được thảo luận rộng rãi cho rằng thị trường AI của Trung Quốc sẽ nhỏ hơn vì các công ty Trung Quốc thường không sẵn lòng trả tiền cho phần mềm, và do đó sẽ không bao giờ có thể khai thác được một thị trường suy luận đủ lớn để hỗ trợ các phòng thí nghiệm.
Tuy nhiên, đánh giá này chỉ áp dụng cho chi tiêu phần mềm tương ứng với hệ sinh thái SaaS. Và hệ sinh thái SaaS ở Trung Quốc lịch sử vẫn rất nhỏ. Mặt khác, rõ ràng Trung Quốc vẫn có một thị trường điện toán đám mây khổng lồ.
Một câu hỏi quan trọng nhưng chưa có lời giải đáp là: liệu chi tiêu của các công ty Trung Quốc cho AI sẽ giống với thị trường SaaS – quy mô nhỏ hơn – hay thị trường điện toán đám mây – chi tiêu cơ bản? Câu hỏi này đang được thảo luận ngay cả trong các phòng thí nghiệm Trung Quốc. Nhìn chung, tôi cảm thấy AI đang tiến gần hơn đến thị trường điện toán đám mây, và không ai thực sự lo lắng rằng thị trường xung quanh các công cụ mới sẽ không tăng trưởng.
Thứ hai, hầu hết các nhà phát triển đều chịu ảnh hưởng rất lớn từ Claude.
Mặc dù Claude về mặt lý thuyết bị cấm ở Trung Quốc, hầu hết các nhà phát triển AI ở Trung Quốc đều rất thích thú với nó và cách nó đã thay đổi cách họ xây dựng phần mềm. Chỉ vì Trung Quốc trước đây ít sẵn lòng mua phần mềm không có nghĩa là tôi cho rằng sẽ không có tăng trưởng mạnh mẽ về nhu cầu suy luận ở đó.
Các chuyên gia kỹ thuật Trung Quốc rất thực tế, khiêm tốn và động lực. Điều này gây ấn tượng mạnh mẽ với tôi hơn bất kỳ thói quen lịch sử về việc "không mua phần mềm".
Một số nhà nghiên cứu Trung Quốc đề cập đến việc sử dụng các công cụ riêng của họ để xây dựng mô hình, chẳng hạn như Kimi hoặc các công cụ dòng lệnh của GLM, nhưng tất cả đều nhắc đến việc sử dụng Claude. Điều đáng ngạc nhiên là rất ít người nhắc đến Codex, một công cụ rõ ràng đang nhanh chóng trở nên phổ biến ở khu vực Vịnh San Francisco.
Thứ ba, các công ty Trung Quốc có tư duy sở hữu công nghệ.
Văn hóa Trung Quốc đang hòa quyện với động lực kinh tế bùng nổ, tạo ra một số kết quả khó lường. Một ấn tượng sâu sắc mà tôi có được là số lượng lớn các mô hình AI phản ánh sự cân bằng thực dụng giữa nhiều công ty công nghệ ở đây. Không có một kế hoạch tổng thể duy nhất nào.
Ngành công nghiệp này được định hình bởi sự tôn trọng dành cho ByteDance và Alibaba, những tập đoàn lớn cho rằng đủ nguồn lực để giành được thị phần đáng kể. DeepSeek là một công ty dẫn đầu về công nghệ được kính trọng, nhưng còn xa mới đạt đến vị trí dẫn đầu thị trường. Họ định hướng chiến lược, nhưng thiếu cấu trúc kinh tế cần thiết để chinh phục thị trường.
Điều này đã khiến các công ty như Meituan hay Ant Group phải xây dựng những mô hình tương tự. Người phương Tây có thể ngạc nhiên khi biết rằng họ cũng đang xây dựng những mô hình này. Nhưng trên thực tế, họ rõ ràng coi các mô hình ngôn ngữ quy mô lớn là cốt lõi của các sản phẩm công nghệ tương lai, và do đó, họ cần một nền tảng vững chắc.
Khi các công ty tinh chỉnh một mô hình mạnh mẽ, đa năng, phản hồi từ cộng đồng mã nguồn mở sẽ củng cố hệ thống công nghệ của họ, đồng thời cho phép họ giữ lại các phiên bản sản phẩm đã được tinh chỉnh nội bộ. Tư duy "ưu tiên mã nguồn mở" trong ngành này phần lớn được định hình bởi tính thực dụng: nó giúp các mô hình nhận được phản hồi tích cực, đóng góp cho cộng đồng mã nguồn mở và thúc đẩy sứ mệnh của chính họ.
Thứ tư, sự hỗ trợ của chính phủ là có thật, nhưng quy mô thì chưa rõ ràng.
Người ta thường khẳng định rằng chính phủ Trung Quốc đang tích cực hỗ trợ Cuộc thi Mô hình hóa Ngôn ngữ Quy mô Lớn Mở (Open Large Language Modeling Competition). Tuy nhiên, đây là một hệ thống chính phủ tương đối phi tập trung bao gồm nhiều tầng lớp, và mỗi tầng lớp lại thiếu một cẩm nang vận hành rõ ràng quy định trách nhiệm của mình.
Các khu phố khác nhau ở Bắc Kinh đang cạnh tranh nhau để thu hút các công ty công nghệ đến đặt văn phòng. "Sự hỗ trợ" dành cho các công ty này gần như chắc chắn bao gồm việc loại bỏ các thủ tục hành chính rườm rà, chẳng hạn như gia hạn giấy phép. Nhưng sự hỗ trợ này có thể đi đến đâu? Liệu các cấp chính quyền khác nhau có thể giúp thu hút nhân tài? Liệu họ có thể tạo điều kiện cho việc buôn lậu chip?
Trong suốt chuyến thăm, quả thực có nhiều đề cập đến sự quan tâm hoặc hỗ trợ của chính phủ, nhưng thông tin liên quan vẫn chưa đủ để tôi báo cáo chi tiết một cách chắc chắn, cũng như không đủ để tôi hình thành một quan điểm tự tin về việc chính phủ thực sự có thể thay đổi quỹ đạo phát triển trí tuệ nhân tạo ở Trung Quốc như thế nào.
Dĩ nhiên, hoàn toàn không có dấu hiệu nào cho thấy các cấp cao nhất của chính phủ Trung Quốc đã tác động đến bất kỳ quyết định kỹ thuật nào liên quan đến mô hình này.
Thứ năm, ngành công nghiệp dữ liệu kém phát triển hơn nhiều so với phương Tây.
Trước đây chúng ta từng nghe nói rằng Anthropic hay OpenAI chi hơn 10 triệu đô la cho một hoàn cảnh duy nhất, với tổng chi phí hàng năm lên tới hàng trăm triệu đô la để thúc đẩy sự phát triển của học tăng cường. Do đó, chúng tôi tò mò liệu các phòng thí nghiệm Trung Quốc cũng đang mua hoàn cảnh tương tự từ các công ty Mỹ hay không, hoặc liệu có một hệ sinh thái nội địa tương tự hỗ trợ họ hay không.
Câu trả lời không phải là ngành công nghiệp dữ liệu hoàn toàn không tồn tại, mà là, dựa trên kinh nghiệm của họ, chất lượng dữ liệu trong ngành này tương đối kém. Do đó, trong nhiều trường hợp, việc tự xây dựng hoàn cảnh hoặc dữ liệu nội bộ sẽ tốt hơn. Các nhà nghiên cứu dành lượng lớn để tự tạo ra hoàn cảnh huấn luyện học tăng cường, trong khi các công ty lớn hơn như ByteDance và Alibaba có thể có đội ngũ chú thích dữ liệu nội bộ để hỗ trợ việc này. Tất cả điều này phản ánh tư duy "tự xây dựng hơn là mua" đã đề cập trước đó.
Thứ sáu, nhu cầu về chip Nvidia đang rất mạnh.
Tỷ lệ băm của Nvidia là tiêu chuẩn vàng cho việc huấn luyện, và sự tiến bộ của mọi người bị hạn chế bởi sự thiếu hụt tỷ lệ băm lớn hơn. Nếu nguồn cung đủ, họ rõ ràng sẽ mua. Accelerator khác, bao gồm nhưng không giới hạn ở của Huawei, đã nhận được đánh giá tích cực về khả năng suy luận. Vô số phòng thí nghiệm có quyền truy cập vào chip của Huawei.
Những điểm mấu chốt này mô tả một hệ sinh thái AI rất khác biệt. Việc nhanh chóng áp dụng các phương pháp vận hành của các phòng thí nghiệm phương Tây cho các đối tác Trung Quốc thường dẫn đến việc phân loại sai. Câu hỏi quan trọng là liệu các hệ sinh thái khác nhau này có tạo ra các loại mô hình khác biệt đáng kể hay không; hay liệu các mô hình của Trung Quốc sẽ luôn được hiểu là tương tự như các mô hình tiên tiến của Mỹ từ 3 đến 9 tháng trước.
Kết luận: Cân bằng toàn cầu
Trước chuyến đi lần, tôi biết rất ít về Trung Quốc; và khi rời đi, tôi cảm thấy mình chỉ mới bắt đầu tìm hiểu. Trung Quốc không phải là một nơi có thể được diễn tả bằng các quy tắc hay công thức, mà là một nơi có động lực và sự tương tác rất khác biệt. Nền văn hóa của nó cổ kính, sâu sắc và vẫn còn gắn bó mật thiết với cách thức phát triển công nghệ trong nước. Tôi vẫn còn rất nhiều điều phải học hỏi.
Nhiều bộ phận trong cơ cấu quyền lực hiện tại của Hoa Kỳ sử dụng quan điểm hiện có của họ về Trung Quốc như một công cụ tâm lý quan trọng trong việc ra quyết định. Sau khi có các cuộc trao đổi trực tiếp chính thức hoặc không chính thức với hầu hết các phòng thí nghiệm trí tuệ nhân tạo hàng đầu ở Trung Quốc, tôi nhận thấy rằng Trung Quốc sở hữu nhiều phẩm chất và bản năng khó có thể mô phỏng bằng các phương pháp ra quyết định của phương Tây.
Ngay cả khi tôi hỏi trực tiếp các phòng thí nghiệm này lý do tại sao họ lại phát hành những mô hình mạnh nhất của mình, tôi vẫn thấy khó có thể hiểu được mối liên hệ giữa "tư duy sở hữu" và "sự hỗ trợ thực sự cho hệ sinh thái".
Các phòng thí nghiệm ở đây rất thực dụng; họ không nhất thiết là những người theo chủ nghĩa tuyệt đối về mã nguồn mã nguồn mở, và không phải mọi mô hình họ xây dựng đều sẽ được công khai. Nhưng họ có một ý định sâu sắc là hỗ trợ các nhà phát triển, hỗ trợ hệ sinh thái và sử dụng tính mở như một cách để hiểu rõ hơn về các mô hình của chính họ.
Hầu hết các công ty công nghệ lớn của Trung Quốc đều đang xây dựng mô hình ngôn ngữ tổng quát đa năng của riêng mình. Chúng ta đã thấy các công ty dịch vụ nền tảng như Meituan và các công ty công nghệ tiêu dùng lớn như Xiaomi phát hành các mô hình tỷ trọng mở. Ngược lại, các đối tác Mỹ của họ thường chỉ mua dịch vụ.
Các công ty này đang xây dựng những mô hình ngôn ngữ quy mô lớn không phải để tạo dựng tên tuổi trong những xu hướng mới nhất, mà xuất phát từ một khát vọng sâu sắc và cơ bản: kiểm soát hệ thống công nghệ của riêng mình và phát triển những công nghệ quan trọng nhất hiện nay. Khi tôi ngẩng đầu lên khỏi máy tính xách tay và nhìn lên những cụm cần cẩu trên đường chân trời, điều đó rõ ràng phản ánh văn hóa và năng lượng xây dựng rộng lớn hơn của Trung Quốc.
Sự gần gũi, duyên dáng và ấm áp chân thành của các nhà nghiên cứu Trung Quốc thật đáng quý. Về mặt cá nhân, những cuộc thảo luận địa chính trị gay gắt mà chúng ta thường thấy ở Mỹ hoàn toàn không có sự hiện diện của họ. Thế giới cần nhiều hơn nữa sự tích cực giản dị này. Là một thành viên của cộng đồng AI, giờ đây tôi càng lo ngại hơn về những rạn nứt ngày càng lớn giữa các thành viên và các nhóm xoay quanh nhãn mác quốc tịch.
Sẽ là nói dối nếu tôi nói rằng tôi không muốn các phòng thí nghiệm của Mỹ trở thành những người dẫn đầu rõ ràng trong mọi khía cạnh của công nghệ AI. Đặc biệt là trong lĩnh vực mô hình mở, nơi tôi đã dành lượng lớn thời gian, việc là của Mỹ là một sự ưu tiên chân thành.
Đồng thời, tôi hy vọng rằng hệ sinh thái mở có thể phát triển mạnh mẽ trên toàn cầu, bởi vì nó có thể tạo ra trí tuệ nhân tạo an toàn hơn, dễ tiếp cận hơn và hữu ích hơn cho thế giới. Câu hỏi đặt ra hiện nay là liệu các phòng thí nghiệm của Mỹ có hành động để đảm nhận vị trí lãnh đạo này hay không.
Khi tôi viết xong đoạn này, ngày càng có nhiều tin đồn lan truyền về tác động của sắc lệnh hành pháp đối với mô hình mở. Điều này có thể làm phức tạp thêm sự phối hợp giữa vai trò lãnh đạo của Hoa Kỳ và hệ sinh thái toàn cầu – và nó chẳng giúp tôi cảm thấy tự tin hơn chút nào.
Tôi xin chân thành cảm ơn tất cả những người tuyệt vời mà tôi đã có cơ hội trò chuyện cùng tại Lunar Dark Side, Zhipu, Meituan, Xiaomi, Tongyi Qianwen, AntLight, 01.ai và các tổ chức khác. Mọi người đều rất nhiệt tình và hào phóng trả giá thời gian cho tôi. Khi những ý tưởng của tôi dần hình thành, tôi sẽ tiếp tục chia sẻ những quan sát của mình về Trung Quốc, bao gồm cả các khía cạnh văn hóa rộng hơn và lĩnh vực trí tuệ nhân tạo.
Rõ ràng, kiến thức này sẽ liên quan trực tiếp đến diễn biến của những phát triển tiên tiến trong lĩnh vực trí tuệ nhân tạo.




