Trong làn sóng công nghệ ngày nay, những nhà đổi mới và doanh nghiệp đang phải đối mặt với những thách thức nghiêm trọng do sự va chạm dữ dội giữa niềm tin công nghệ và luật thương mại gây ra, và bị mắc kẹt trong ba tình thế tiến thoái lưỡng nan chính: vách đá công nghệ, khoảng cách kỹ thuật và sương mù thương mại. Vậy, tiêu chuẩn vàng để xác định các kịch bản "vòng khép kín có giá trị cao - có thể thiết kế - mạnh mẽ" là gì? Làm thế nào để đạt được "cuộc chạy đua hai chiều" của AI và việc kinh doanh dựa trên các khả năng nền tảng như LLMOps?
Gần đây, chuyên mục phát sóng trực tiếp "Geek Appointment" của InfoQ X AICon đã đặc biệt mời Đồng sáng lập & Giám đốc công nghệ của Mars Radio Xu Wenjian, Chuyên gia kỹ thuật cấp cao của Alibaba Li Chenzhong và Nhà sáng lập AutoGame Zhang Haoyang đến thảo luận về con đường thực sự để triển khai các sản phẩm mô hình quy mô lớn khi Hội nghị ứng dụng và phát triển trí tuệ nhân tạo toàn cầu AICon 2025 tại Đài Bắc Kinh sắp được tổ chức.
Sau đây là một số quan điểm:
- Trong tương lai, các mô hình lớn sẽ trở thành tài nguyên công cộng như nước và điện, và chúng ta nên tập trung nhiều hơn vào việc xây dựng các mô hình, sản phẩm và bánh đà dữ liệu thuộc phạm vi riêng tư.
- Việc đào tạo các mô hình lớn chung sẽ hấp thụ tất cả dữ liệu có sẵn, do đó chỉ thông tin thực sự nằm trong "các đảo dữ liệu" mới có thể tạo nên lợi thế độc đáo.
- Sản phẩm có thể cung cấp trong tương lai sẽ không còn là mã lệnh nữa mà là khả năng dựa trên mô hình.
- Sự đổi mới thực sự sẽ diễn ra ở lớp ứng dụng: dựa trên cơ sở chung và kết hợp chuyên môn trong nhiều lĩnh vực khác nhau, chúng tôi sẽ xây dựng các ứng dụng theo kịch bản dọc phong phú.
- Tài năng truyền thống nhấn mạnh vào chuyên môn độ sâu trong các lĩnh vực dọc và đóng nhân vật chuyên gia hoặc người thực hiện trong các tổ chức lớn. Giá trị cốt lõi của tài năng tương lai nằm ở tầm nhìn rộng, chẳng hạn như các nhà phát triển hiểu được logic thiết kế, sản phẩm và nghệ thuật cùng một lúc.
Nội dung sau đây dựa trên bản ghi chép phát sóng trực tiếp và đã được InfoQ biên tập.
Chúng ta "bắt đầu làm AI" từ khi nào?
Xu Wenjian: Khi GPT mới ra mắt, bạn nghĩ gì? Có lúc nào bạn nghĩ rằng “Mình phải làm gì đó ngay lập tức” không?
Lý Thần Trung: Khi tôi làm việc trên một robot dịch vụ khách hàng thông minh vào năm 2012, tôi đã cố gắng sử dụng phương pháp truyền thống để cải thiện kết quả, nhưng tôi không thể vượt qua được nút thắt. Cho dù đó là khớp câu hay biểu thức đầy đủ, kết quả đều cứng nhắc và máy móc. Ngay cả khi tôi sử dụng các kỹ năng ngôn ngữ để cố gắng bắt chước câu trả lời của con người, nội dung thường trống rỗng và không có căn cứ, chỉ là trò chơi chữ. Sau đó, khi ngành công nghiệp trải qua làn sóng AI vào năm 2015 và 2016, tôi đã quan sát thấy nhiều trường hợp, nhưng tôi luôn cảm thấy rằng khái niệm AI nóng bỏng vào thời điểm đó vẫn còn xa mới đạt được hiệu quả mà tôi mong đợi, cho đến khi GPT xuất hiện.
Lần tôi tiếp xúc với GPT, tôi thấy rằng mô hình ngôn ngữ lớn hoàn toàn khác biệt so với các công nghệ AI trước đây. Nó biến nhiều điều không thể thành có thể trong quá khứ. Nó không còn giới hạn ở việc xử lý cứng nhắc nhiệm vụ trường dọc cụ thể nữa mà còn cho thấy khả năng lý luận nhất định và có thể diễn đạt bằng ngôn ngữ trôi chảy và tự nhiên, điều này thật tuyệt vời. Do đó, ngay sau khi GPT ra mắt, tôi bắt đầu thử áp dụng nó vào nhiều tình huống khác nhau, dần dần mở rộng từ tóm tắt nội dung sang nhiệm vụ như lý luận và phán đoán. Theo tôi, sự xuất hiện của GPT đánh dấu sự mở ra cánh cửa đến một thế giới mới, giống như sự ra đời của khoảnh khắc kỳ dị, báo hiệu sự xuất hiện của một kỷ nguyên hoàn toàn khác.
Zhang Haoyang: Là một người dùng GPT đầu tiên, tôi nhớ rằng cuối cùng tôi cũng có một tài khoản vào ngày thứ năm sau khi ra mắt. Sự phấn khích mà GPT mang lại khiến tôi thức trắng đêm, và tôi khám phá khả năng của nó mỗi ngày. Vào thời điểm đó, OpenAI vẫn chưa phải là một gã khổng lồ, và những tin đồn về việc hợp tác với Microsoft, chẳng hạn như tin tức Bing sẽ kết nối với GPT, cũng gây ra một sự xôn xao. Chưa đầy một tháng sau, ChatGPT đã vượt qua mốc 100 triệu người dùng với tốc độ nhanh nhất trong lịch sử, báo hiệu sự xuất hiện của cuộc cách mạng AI tạo sinh.
Sau khi phát hành GPT 3.5, mức độ thông minh của nó đã mang đến cú sốc mang tính kỷ nguyên. Kể từ đó, vì tôi tập trung vào các ứng dụng trong lĩnh vực trò chơi, tôi chủ yếu tập trung vào hai hướng chính: một là ứng dụng NPC. Mô hình ngôn ngữ lớn có khả năng cung cấp giá trị tâm lý và giải quyết vấn đề, và có thể tồn tại như một NPC trong trò chơi; thứ hai là lĩnh vực lập trình AI. Ngay sau khi ra mắt GPT, Cursor đã trở thành một trong những sản phẩm đầu tiên tích hợp các khả năng của mô hình lớn vào trình soạn thảo VS Code. Mặc dù Cursor rất nổi tiếng ngày nay, nhưng nó vẫn là một công cụ rất mới lạ vào đầu năm 2023, hiện thực hóa lập trình hỗ trợ AI ban đầu và sau đó dần dần phát triển khái niệm lập trình Agent cho đến Vibe Coding vào năm 2025.
Xu Wenjian: Trải nghiệm của tôi hơi khác so với hai giáo viên kia. Không có bước ngoặt rõ ràng nào của việc "cống hiến hết mình cho AI", mà là một quá trình thay đổi về lượng sang thay đổi về chất. GPT cũng khiến tôi sốc khi lần đầu tiên xuất hiện, vì vậy vào đầu năm 2023, tôi đã cùng một số người bạn tiến sĩ từ Đại học Sư phạm Bắc Kinh với tư duy học hỏi phát triển một sản phẩm giáo dục cá nhân hóa AI. Mặc dù dự án cuối cùng đã thất bại do năng lực cá nhân không đủ, nhưng nó đã gieo vào lòng tôi một hạt giống: AI thực sự có thể thay đổi nhiều thứ và có thể là một cơ hội quý giá cho thế hệ chúng ta. Sau khi dự án thất bại, tôi đã gia nhập Baichuan Intelligence, hy vọng hiểu được sự hiểu biết và thực hành công nghệ của các công ty AI tiên tiến tại Trung Quốc. Trong thời gian ở Baichuan, tôi đã học các công nghệ như Agent và sau khi rời đi, tôi tiếp tục đầu tư vào tinh thần kinh doanh AI. Cuối cùng, sự tích lũy này đã kích hoạt một sự thay đổi về chất tại một thời điểm nào đó - tôi đột nhiên nhận ra rằng mình đã tham gia sâu vào lĩnh vực AI.
Xu Wenjian: Sự thay đổi nhận thức lớn nhất trong hai năm qua là gì? Bạn có thể chia sẻ bất kỳ "câu chuyện" hay trải nghiệm đáng nhớ nào không?
Lý Thần Trung: Tôi là người có chủ nghĩa duy tâm về công nghệ, tôi cũng thích xem phim khoa học viễn tưởng, như Jarvis trong Iron Man và nhân vật trí tuệ nhân tạo khác. Do đó, tôi rất kinh ngạc trước sự phát triển nhanh chóng của AI. Nhưng nói khi nào có sự thay đổi lớn về nhận thức thì quá trình đó thực ra không rõ ràng.
Sự thay đổi đáng kể duy nhất là tôi thấy rằng nhiều ý tưởng từng chỉ tồn tại trong trí tưởng tượng đang ngày càng trở nên khả thi hơn. Tôi đã bắt đầu với phiên bản ChatGPT cũ hơn và hiệu ứng của nó trong một số tình huống thật đáng kinh ngạc. Khi mô hình được lặp lại và nâng cấp nhanh chóng, khả năng của nó liên tục được cải thiện, khiến con đường hiện thực hóa trong tương lai ngày càng rõ ràng hơn. Trước đây, sự phát triển của ngành công nghiệp Internet thay đổi theo từng ngày trôi qua, nhưng tốc độ tiến bộ của AI trong hai hoặc ba năm qua hoàn toàn là một cấp độ khác. Trong hai hoặc ba năm kể từ khi AI bùng nổ, tốc độ phát triển của toàn bộ lĩnh vực này đã nhanh đến mức thậm chí có thể nói là vượt quá sức tưởng tượng của tôi.
Có một câu có thể diễn tả tâm trạng của tôi lúc đó: Tôi đột nhiên phát hiện ra rằng mình đã tìm thấy một "lực lượng lao động tự do" có thể xử lý nhiều thứ như con người. Một ý tưởng khác mà tôi có vào thời điểm đó là: việc xây dựng một thế giới ảo do AI điều khiển đã trở nên khả thi. Đối với tôi, những cảnh được mô tả trong các bộ phim khoa học viễn tưởng và nhiều ý tưởng cá nhân của tôi không còn là tưởng tượng nữa mà đã trở thành những mục tiêu khả thi với con đường rõ ràng để hiện thực hóa.
Sự xuất hiện của những điều mới mẻ thường dẫn đến hai thái độ: một là đón nhận chúng một cách phấn khích, nhìn thấy cơ hội và chủ động thử chúng; hai là chờ đợi và xem xét một cách thận trọng. Điều này có nghĩa là khi bạn thử những điều mới mẻ, bạn thường bị kẹt giữa hai thái độ này. Ví dụ, khi AI mới xuất hiện, tôi rất muốn trong đó, nhưng nhiều người lại bảo thủ, cho rằng thời điểm chưa thích hợp hoặc công nghệ vẫn chưa hoàn thiện.
Trong giai đoạn này, tôi nhận ra sự cần thiết của sự kiên trì. Khi bạn đưa ra một ý tưởng sáng tạo, nó hiếm khi được công nhận rộng rãi. Thay vào đó, mọi người có nhiều khả năng chờ đợi và xem hoặc thậm chí phản đối nó. Trong trường hợp này, việc thúc đẩy mọi thứ trở nên khó khăn - không dễ để thuyết phục người khác. Do đó, bạn thường phải đối mặt với tình huống tự mình khăng khăng nhưng thiếu sự hỗ trợ, và quá trình này chắc chắn sẽ đầy thách thức.
Zhang Haoyang: Tôi vẫn làm việc tại Tencent vào năm 2023 và tôi đã rời đi để bắt đầu kinh doanh riêng vào cuối năm. Là người hành nghề trong một công ty lớn vào những ngày đầu, tôi hiểu rằng cần phải phát triển các mô hình lớn càng sớm càng tốt, thay vì chỉ dựa vào các giao diện bên ngoài. Đây gần như là sự đồng thuận của ngành trong nửa đầu năm 2023. Các công ty lớn đã cam kết hoàn toàn vào việc phát triển các mô hình lớn và Tencent cũng đã tung ra một mô hình hỗn hợp.
Bước ngoặt đến vào giữa năm 2023, khi mô hình LLaMA vô tình bị rò rỉ và mã nguồn mở. Cộng đồng mô hình lớn của Trung Quốc nhanh chóng trở nên năng động và các công ty khởi nghiệp sau này được gọi là "Sáu chú rồng nhỏ của AI" đã xuất hiện. Nhưng đến nửa đầu năm 2024, một sự thay đổi nhận thức sâu sắc là nhiều người đã từ bỏ ý tưởng phát triển các mô hình lớn của riêng mình. Lý do là, cả trong và ngoài nước, khả năng của các mô hình cơ bản khác nhau đã nhiều lần chứng minh rằng đào tạo mô hình lớn không phải là điều mà ai cũng có thể làm được và tầm quan trọng của việc đào tạo hoặc tinh chỉnh từ đầu đang suy yếu. Đặc biệt là sau khi công nghệ RAG xuất hiện, các cơ chế truy xuất và sắp xếp tuyệt vời thường có thể đạt được kết quả lý tưởng, điều này đã trở thành sự đồng thuận chung vào năm 2024.
Năm 2024 được gọi là "Năm ứng dụng AI", nhưng sự bùng nổ thực sự sẽ diễn ra vào năm 2025. Lấy các công cụ lập trình AI làm ví dụ: sau khi phát hành Claude 3.7 vào cuối tháng 2 năm 2025, các sản phẩm được Cursor đại diện đã nhảy vọt từ lập trình phụ trợ sang lập trình AI thực sự. Sự cải thiện về trí thông minh của mô hình đã thay đổi hoàn toàn sản phẩm và khả năng ngược dòng và xuôi dòng. Điều này lần lượt dẫn đến một sự hiểu biết mới: các mô hình nhỏ tự phát triển sẽ trở nên cần thiết trong tương lai.
Các công ty khởi nghiệp AI Agent cần xây dựng tam giác sắt "sản phẩm dữ liệu-mô hình" và chỉ khi cả ba kết hợp chặt chẽ thì mới có thể thiết lập được rào cản. Ví dụ: nếu chỉ có sản phẩm và mô hình, các doanh nhân cần dựa vào công việc hời hợt như kỹ thuật từ ngữ nhanh. Tuy nhiên, với việc ra mắt các chức năng plug-in của OpenAI, lượng lớn các ứng dụng shell đã bị loại bỏ, chứng tỏ rằng loại mô hình này không có rào cản. Đặc biệt là khi các mô hình như Claude 4 có trình độ kỹ sư cao cấp hoặc thậm chí là kiến trúc sư, không gian ứng dụng cấp cao hơn lại càng bị nén lại. Một loại khác là khái niệm "mô hình lớn miền riêng" phổ biến vào năm ngoái, chẳng hạn như tích hợp dữ liệu bẩn trong lĩnh vực y tế để đào tạo các mô hình độc quyền. Nếu thiếu lối vào sản phẩm trực tiếp hướng đến người dùng, loại công việc này dễ bị chìm xuống biển hoặc trở thành váy cưới của người khác - vì không thể hình thành vòng lặp dữ liệu khép kín.
Lấy Cursor làm ví dụ: nó kết nối với các mô hình như Claude, Gemini và OpenAI, nhưng nếu người dùng không bật chế độ riêng tư, mã được tạo có thể được sử dụng để đào tạo các mô hình lập trình tự phát triển. Cursor xử lý nhiệm vụ như chỉnh sửa tệp thông qua Chuỗi công cụ tương tự như cơ chế MCP, đồng thời tích lũy dữ liệu về hành vi của người dùng. Khi trở thành điểm vào cho thói quen của người dùng, mô hình của nó có thể lập trình tốt hơn mô hình cơ bản. Những sản phẩm như vậy có thể xuất hiện trong nhiều lĩnh vực khác nhau trong tương lai, chẳng hạn như trò chơi tự phát triển và các công cụ xã hội. Tất nhiên, chúng ta cũng phải cảnh giác với sự độc quyền của những gã khổng lồ. Giá trị cốt lõi của các mô hình nhỏ miền riêng do tự phát triển nằm ở chỗ: sau khi kết hợp kiến thức miền với các sản phẩm để hình thành bánh đà dữ liệu, sản phẩm- dữ liệu-mô hình hình thành mối quan hệ sinh thái gắn kết chặt chẽ, khiến ngay cả các công ty lớn cũng khó có thể tham gia, do đó tạo ra các rào cản.
Một nhận thức đáng chú ý khác là chi phí cho các mô hình lớn đang giảm theo cấp số nhân. Vào tháng 3 năm 2023, thí nghiệm Stanford Town tốn hàng nghìn đô la để chạy mỗi đêm. Nhưng chỉ nửa năm sau, khả năng của mô hình được cải thiện và giá đã giảm mạnh. Đến tháng 5 năm 2024, các mô hình như DeepSeek đã tương đương với GPT-4, nhưng chi phí chỉ bằng 10% của GPT-4. Năm nay, chi phí gần như miễn phí - lấy tương tác AI NPC trong trò chơi của chúng tôi làm ví dụ, hàng nghìn người chơi chỉ chi hàng chục đô la cho các mã thông báo mô hình lớn mỗi tháng. Trong tương lai, các mô hình lớn sẽ trở thành tài nguyên công cộng như nước và điện, và chúng ta nên tập trung nhiều hơn vào việc xây dựng các mô hình, sản phẩm và bánh đà dữ liệu miền riêng.
Xu Wenjian: Cursor có thể làm được điều này vì nó đã trở thành người dẫn đầu không thể tranh cãi trong ngành và có đủ dữ liệu để hỗ trợ việc đào tạo các mô hình nhỏ và giảm chi phí. Nhưng đối với hầu hết các công ty, trước khi trở thành người dẫn đầu ngành, khả năng thu thập dữ liệu của họ không thể cạnh tranh với các công ty lớn đào tạo các mô hình lớn nói chung.
Li Chenzhong: Điều này cũng giải thích tại sao mọi người thường tập trung vào việc tinh chỉnh mô hình khi các mô hình lớn mới xuất hiện. Vì các mô hình lớn được lặp lại rất nhanh nên nâng cấp phiên bản của chúng thường dựa trên lớp phủ. Về bản chất, chỉ có đội ngũ hàng đầu hoặc các công ty lớn có nguồn lực dồi dào mới có thể tiếp tục đầu tư vào việc đào tạo các mô hình lớn. Nếu đội ngũ thông thường đầu tư vào việc đào tạo, kết quả của họ có khả năng bị ghi đè bởi sự tiến triển của các mô hình lớn đa năng trong ngắn hạn.
Tôi cho rằng tình huống có giá trị hoặc ngưỡng duy nhất là dữ liệu của bạn là một nguồn tài nguyên độc quyền không thể có được trên Internet hoặc dữ liệu được cá nhân hóa cao trong một lĩnh vực dọc cụ thể và cực kỳ khó để các công ty bên ngoài truy cập. Việc đào tạo mô hình lớn chung sẽ hấp thụ tất cả dữ liệu có sẵn, do đó chỉ những thông tin thực sự nằm trong "kho dữ liệu riêng" mới có thể tạo nên lợi thế độc đáo. Nếu dữ liệu không có bản chất này, tôi cho rằng khả năng lặp lại nhanh chóng của mô hình lớn chung sẽ nhanh chóng bao phủ kết quả đào tạo của một đội ngũ cụ thể.
Trương Hạo Dương: Hai người có tin rằng trong tương lai sẽ có một tác nhân thực sự phổ quát không? Có đáng để đầu tư vào các sản phẩm như Manus không?
Cá nhân tôi không tin rằng các tác nhân phổ quát sẽ trở thành hiện thực. Điều này là do dữ liệu và mô hình miền riêng có giá trị độc đáo, không thể dễ dàng sao chép được bởi các công ty lớn chỉ với lượng dữ liệu khổng lồ. Nó thường đòi hỏi kiến thức chuyên sâu về ngành (bí quyết). Cốt lõi là dữ liệu và sản phẩm phải được kết hợp chặt chẽ để tạo thành một rào cản thực sự.
Lấy trò chơi của chúng tôi làm ví dụ: chúng tôi đã thiết kế một bộ giao diện độc quyền có các quy tắc chỉ áp dụng cho hoàn cảnh trò chơi. Người chơi điều khiển AI để tạo ra logic mới trong trò chơi thông qua các hướng dẫn bằng ngôn ngữ tự nhiên. Sau đó, chúng tôi sử dụng dữ liệu được tạo ra để tinh chỉnh mô hình nhỏ độc quyền, giúp nó ngày càng tốt hơn trong việc tạo mã cho sản phẩm này. Ngay cả khi các công ty lớn có được loại dữ liệu này, thì cũng khó có thể sử dụng hiệu quả vì nó gắn chặt với các sản phẩm cụ thể. Do đó, việc xây dựng các mô hình miền riêng cho các sản phẩm cụ thể vẫn có giá trị. Tất nhiên, các công ty lớn có thể đạt được đột phá trong một lĩnh vực dọc nhất định, nhưng kết quả mô hình của họ cuối cùng chỉ có thể phục vụ cho các sản phẩm cụ thể chứ không phải là toàn năng.
Tôi cho rằng các sản phẩm cung cấp trong tương lai sẽ không còn là mã nữa, mà là khả năng điều khiển theo mô hình, có thể hiểu là MAAS (Mô hình dưới dạng dịch vụ). Các sản phẩm sẽ được điều khiển bởi các mô hình lớn để đạt được sự tự lặp lại và tiến hóa. Điều này dẫn đến lý do cốt lõi khiến tôi đặt câu hỏi về tác nhân chung: liệu Manus có phải là một sản phẩm tương tự, "tính phổ quát" của nó bị hạn chế và hiệu suất của nó trong các tình huống cụ thể thường kém hơn so với các sản phẩm của đội ngũ tập trung vào lĩnh vực này.
Nhìn rộng ra, tôi không cho rằng có thể đầu tư nguồn nhân lực lớn để tinh chỉnh trải nghiệm người dùng và dữ liệu của tất cả các phân khúc để mang lại kết quả khả quan. Ít nhất là trong 3 đến 5 năm tới, điều này là không khả thi. Trừ khi công nghệ AI phát triển đến mức có thể tự đào tạo - ví dụ, thông qua cơ chế chiến đấu trái-phải giống GAN, nó liên tục tối ưu hóa trong các tình huống cụ thể và cuối cùng đạt đến trình độ của các sản phẩm hàng đầu trong lĩnh vực này. Mặc dù vậy, tôi vẫn nghi ngờ liệu "tác nhân phổ quát" này có còn được gọi là "phổ quát" hay không.
Li Chenzhong: Bạn đang thảo luận nhiều hơn về các kịch bản ứng dụng độ sâu trong các lĩnh vực dọc - những kịch bản này không có khả năng được bao phủ bởi một sản phẩm duy nhất. Mô hình lớn chung cung cấp các khả năng cơ bản, chẳng hạn như trí thông minh mạnh hơn, tuân thủ lệnh tốt hơn, tốc độ phản hồi nhanh hơn và chuỗi lý luận hoàn thiện hơn.
Khi khả năng cơ sở được áp dụng cho một lĩnh vực dọc, nó cần được tùy chỉnh cho lĩnh vực đó, tương tự như sự phân công lao động giữa con người. Cơ sở sinh lý của tất cả mọi người về cơ bản là giống nhau, nhưng chiều sâu chuyên môn được hình thành thông qua việc bồi dưỡng sâu sắc ngành công nghiệp. Các hệ thống được xây dựng trong một lĩnh vực dọc cụ thể sẽ tiếp tục tích lũy và tối ưu hóa xung quanh lĩnh vực đó, do đó trở nên sâu sắc hơn và chuyên nghiệp hơn trong lĩnh vực đó. Mặc dù mô hình cơ sở cơ bản có thể giống nhau, nhưng thiết kế của lớp ứng dụng khiến nó tập trung vào một hướng cụ thể.
Lý do tôi tin rằng các tác nhân phổ quát là khả thi không phải vì một tác nhân duy nhất có thể xử lý tất cả nhiệm vụ miền mà không cần thích nghi, mà là vì các tác nhân như vậy có một khuôn khổ khả năng cơ bản tương tự như con người - chúng đã hoàn thành quá trình tiến hóa từ "khỉ thành người" và có khả năng lập kế hoạch, khả năng suy luận logic dựa trên thông tin bối cảnh và khả năng gọi công cụ. Ứng dụng của nó trong các lĩnh vực khác nhau sẽ có hiệu suất khác nhau. Lý do là: thứ nhất, cơ sở kiến thức miền được định cấu hình cho nó là khác nhau và kiến thức thu được thông qua RAG cũng sẽ khác nhau; thứ hai, các công cụ miền được định cấu hình là khác nhau. Không có tác nhân nào được trang bị tất cả các công cụ MCP. Ngay cả Manus cũng sẽ chỉ định cấu hình các công cụ tương ứng theo nhu cầu miền cụ thể. Ví dụ, các Tác nhân trong lĩnh vực trò chơi sẽ được trang bị các công cụ MCP kết hợp với các sản phẩm trò chơi, trong khi các Tác nhân trong lĩnh vực y tế hoặc các lĩnh vực khác sẽ được trang bị các bộ công cụ liên quan đến lĩnh vực đó.
Do đó, logic đằng sau việc thành lập Manus là cơ sở cốt lõi của nó có khả năng phổ quát. Khi nguồn đầu vào tương ứng, Chuỗi công cụ chuyên dụng và cơ sở kiến thức miền được gắn trên đó trong lĩnh vực mục tiêu, nó có thể được chuyển đổi thành một hệ thống ứng dụng hiệu quả trong lĩnh vực này. Đây là ý nghĩa của sự tồn tại của các tác nhân phổ quát.
Xu Wenjian: Universal Agent không cần phải đảm nhiệm tất cả nhiệm vụ, cũng không cần phải là một sản phẩm "toàn diện". Nó có thể đóng vai trò là xương sống cốt lõi, tập trung vào việc xử lý các khả năng chung, trong khi để lại kiến thức chuyên môn trong các lĩnh vực dọc cho các Agent dọc khác nhau được gắn trên đó. Giá trị cốt lõi của Universal Agent là hoạt động như một trung tâm nhập cảnh hoặc tích hợp để kết nối mô-đun khả năng khác nhau.
Zhang Haoyang: OpenAI đã đề xuất cơ chế Function Calling từ rất lâu rồi, và cộng đồng mã nguồn mở cũng đã khám phá các chức năng tương tự. Tuy nhiên, loại sản phẩm này thực sự không bùng nổ cho đến năm nay. Tôi cho rằng lý do cơ bản nằm ở bước nhảy vọt về khả năng của mô hình cơ bản. Function Calling về cơ bản không khác nhiều so với giao thức gọi công cụ và cốt lõi của cả hai là thực thi các lệnh bên ngoài. Một số người trước đây đã thử triển khai các chức năng tương tự bằng cách gọi các dòng lệnh hoặc Chuỗi công cụ thông qua Function Calling, nhưng hiệu quả còn hạn chế. Sự phổ biến của Manus trùng với thời điểm phát hành Claude 3.7, điều này xác nhận rằng động lực chính là khả năng cơ sở của mô hình đạt đến điểm tới hạn. Ngoài ra, nếu những gã khổng lồ này đưa ra các tiêu chuẩn công cụ thống nhất và mở các mô hình cơ sở mạnh mẽ của họ, người dùng có thể trực tiếp phát triển các ứng dụng phân đoạn dựa trên các khả năng cơ bản. Tại thời điểm này, giá trị của các lớp đóng gói như Manus vẫn còn đang bị nghi ngờ.
Xu Wenjian: Ông Haoyang, sự khác biệt cốt lõi trong nhận thức của chúng ta có thể nằm ở phán đoán về rào cản của Agent. Trong tam giác "sản phẩm- dữ liệu-mô hình" mà ông đề xuất, tôi đặc biệt cho rằng bản thân Agent có một rào cản độc đáo - giá trị của nó bắt nguồn từ kiến thức chuyên môn của lĩnh vực dọc. Ưu điểm của Agent là nó có thể được lặp lại liên tục: dựa trên nâng cấp mô hình lớn chung, nó luôn "đi trước một bước" so với mô hình chung trong một lĩnh vực cụ thể. Ưu điểm này xuất phát từ sự hiểu biết độ sâu và tối ưu hóa lĩnh vực dọc. Do đó, bất kể mô hình chung phát triển như thế nào, các Agent có chuyên môn về lĩnh vực luôn có thể duy trì lợi thế cục bộ.
Li Chenzhong: Về bản chất, không có nhiều khác biệt giữa Function Calling và MCP. Giá trị của MCP nằm ở việc thúc đẩy chuẩn hóa ngành và làm cho các lệnh gọi công cụ trở nên tập trung và chuẩn hóa hơn. Tuy nhiên, khó khăn cốt lõi trong việc xây dựng một Agent xuất sắc nằm ở khả năng lập kế hoạch của nó và chìa khóa cho tương lai của Manus nằm ở đây: làm thế nào để phân tích hiệu quả các bước nhiệm vụ xung quanh mục tiêu và thực hiện chúng tại chỗ? Mặc dù loại lập kế hoạch nhiệm vụ này sẽ khác nhau tùy thuộc vào lĩnh vực cụ thể, nhưng nó cũng sẽ có một cấp độ cơ bản không liên quan đến miền dọc. Tương tự như việc gạt sang một bên các thuộc tính chuyên nghiệp, mọi người đều có khả năng lập kế hoạch cho các công việc hàng ngày như mua sắm hàng tạp hóa và đi du lịch. Sau khi thêm các thuộc tính chuyên nghiệp, chẳng hạn như lập trình viên, họ có khả năng thiết kế kiến trúc hệ thống, viết mã và sử dụng nhiều công cụ độc quyền khác nhau. Sau đó, xung quanh mục tiêu đưa sản phẩm ra thị trường, họ sẽ thực hiện sê-ri các lập kế hoạch và phân tích nhiệm vụ và sử dụng các khả năng trên. Do đó, các Agent sẽ phân biệt theo các lĩnh vực dọc, nhưng cơ sở của họ sẽ có các khả năng lập kế hoạch cơ bản không liên quan đến miền dọc.
Quan điểm của tôi về hình thức sản phẩm trong tương lai có thể cấp tiến hơn: có lẽ hình thức cuối cùng sẽ phát triển thành "Dữ liệu đến Tác nhân". Tất cả các giao diện tương tác có thể được tạo động dựa trên kịch bản hiện tại, với chi phí gần bằng không - giống như Jarvis trong "Iron Man", người có thể tạo giao diện theo thời gian thực theo nhu cầu, huy động các công cụ và cung cấp phản hồi động kết hợp với cơ sở kiến thức.
Về hệ sinh thái Agent, tôi cho rằng trong tương lai sẽ chỉ có một số lượng hạn chế các khuôn khổ Agent mục đích chung, với các khả năng lập kế hoạch/suy nghĩ/nhận thức/gọi công cụ cốt lõi. Dựa trên các cơ sở mục đích chung này, kết hợp với kiến thức chuyên môn và các kịch bản trong nhiều lĩnh vực khác nhau, có thể xây dựng sê-ri các ứng dụng dọc phong phú. Không cần một số lượng lớn các khuôn khổ Agent mục đích chung, nhưng sẽ có nhiều ứng dụng cấp cao hơn.
Khán giả: Ứng xử các cơ hội kinh doanh theo phong cách Manus?
Li Chenzhong: Không thể nói rằng không có cơ hội khởi nghiệp trong lĩnh vực dọc dựa trên các đại lý chung. Nhưng điều đó phụ thuộc vào tốc độ phát triển, sự đổi mới và hiệu quả có thể vượt qua những người chơi hiện tại hay không - giống như sự xuất hiện của DeepSeek. Nếu bạn có một số phương pháp độc đáo, chẳng hạn như đạt được sự đổi mới đáng kể ở các điểm chính như khả năng lập kế hoạch, gọi công cụ và nhận dạng ý định, tôi nghĩ rằng nó đáng để thử.
Zhang Haoyang: Tôi không cho rằng là có nhiều cơ hội. Tôi đã tiếp xúc với đội ngũ sáng lập của Manus và chứng kiến hành trình của công ty từ vô danh đến nổi tiếng chỉ sau một đêm. Theo quan điểm của một nhà đầu tư mạo hiểm, thành công của Manus giống như một “lễ hội tự truyền thông” hơn: các phương tiện truyền thông tự truyền thông trong nước có ảnh hưởng đã tích cực quảng bá sự phổ biến của công ty và chiến lược ban đầu nhắm mục tiêu đến người dùng ở nước ngoài thay vì thị trường trong nước cũng đáng để cân nhắc. Sau khi trở nên phổ biến, công ty nhanh chóng nhận được khoản đầu tư từ Tencent và định giá của công ty đã tăng lên hàng tỷ đô la. Nhưng tôi cho rằng đây giống một “buổi trình diễn” cho thị trường vốn hơn và giá trị sản phẩm thực tế vẫn chưa đạt đến trạng thái lý tưởng của một đại lý chung: phản hồi của người dùng dùng thử ban đầu thấp hơn mong đợi, mức độ phổ biến hiện tại sau khi mở cũng đã giảm xuống và trải nghiệm của người dùng không hoàn hảo. Trong nhiều tình huống phân khúc, việc kết hợp các quy trình làm việc cụ thể với khả năng của mô hình lớn có thể giải quyết vấn đề hiệu quả hơn.
Do đó, khả năng khởi nghiệp như Manus là rất thấp. Không phải để đặt câu hỏi về năng lực của đội ngũ, nhưng vấn đề này có "nguyên nhân đầu tiên": người đầu tiên làm được là thiên tài, người thứ hai là vô ích. Vốn khó có thể mua lại trong câu chuyện này một lần nữa, đặc biệt là khi hiệu ứng thương hiệu của Manus đã hình thành và các rào cản kỹ thuật của nó thường bị đặt câu hỏi. Những kẻ bắt chước sau này sẽ phải đối mặt với câu hỏi "Manus đã nhận được nguồn tiền lớn, làm sao bạn có thể vượt qua?"
Ngoài ra, tôi luôn nghi ngờ về tính khả thi của "sản phẩm đại lý phổ quát" - Tôi không tin rằng một đội ngũ có thể giải quyết mọi tình huống ứng dụng. Trừ khi bạn được định vị để cung cấp "cơ sở" của Đại lý. Nhưng ở giai đoạn hiện tại, điều này vẫn đòi hỏi một đội ngũ chuyên nghiệp để đóng gói công nghệ. Trong tương lai, các mô hình lớn có thể phát triển thành cơ sở hạ tầng cơ bản: người dùng chỉ cần đưa ra yêu cầu đối với Đại lý xung quanh họ và nó sẽ có thể tự viết mã, xây dựng khung và trả về kết quả. Đến lúc đó, đội ngũ tập trung vào các khung cấp cao hơn sẽ không còn cần thiết nữa và các khả năng cốt lõi sẽ được quy cho lớp cơ sở hạ tầng (Infra).
Phần khó khăn nhất trong quá trình phát triển sản phẩm AI từ con số 0 đến 1 là gì?
Xu Wenjian: Chúng tôi đều đã làm việc trên các dự án AI từ đầu. Theo kinh nghiệm của bạn, phần khó nhất là gì? Khả năng mô hình? Vòng lặp khép kín của người dùng? Hay điều gì khác?
Lý Thần Trung: Trên thực tế, khả năng của mô hình thực sự là một nút thắt cổ chai chính, nhưng điều này là tương đối. Sau khi cảnh được chọn, hiệu ứng mô hình thường không ổn định hoặc thấp hơn mong đợi, điều này thường bị cản trở trong giai đoạn đầu. Điều này cần được cải thiện dần dần khi mô hình nâng cấp. Tuy nhiên, trong quá trình thực hiện dự án, tôi đã tìm ra một giải pháp thay thế: khi mô hình đạt đến mức cơ bản, bản thân mô hình không nhất thiết trở thành nút thắt cổ chai tuyệt đối.
Quan sát thói quen sử dụng của người dùng, một hiểu lầm phổ biến là nhập trực tiếp các từ gợi ý dài (hàng trăm hoặc thậm chí hàng nghìn từ) chứa nhiều nhiệm vụ phức tạp vào mô hình, dẫn đến đầu ra không ổn định. Lúc này, rất dễ đổ lỗi cho mô hình không đủ khả năng. Phương pháp cải tiến là chia nhỏ nhiệm vụ phức tạp thành nhiều nhiệm vụ đơn giản và để mô hình hiện tại thực hiện từng bước. Thực tế đã chỉ ra rằng mô hình phản hồi ổn định hơn với nhiệm vụ đơn giản. Khi mô hình nâng cấp, hiệu quả tổng thể sẽ được cải thiện hơn nữa trên cơ sở ban đầu. Điều này tương tự như quản lý: đối diện nhiệm vụ phức tạp, thay thế những người thông minh hơn (nâng cấp mô hình) là một trong những giải pháp, nhưng chia nhỏ nhiệm vụ và để những người bình thường (mô hình hiện tại) thực hiện cũng khả thi.
Do đó, miễn là mô hình đạt đến đường năng lực cơ bản, thì các nút thắt cổ chai trong hầu hết các tình huống đều có thể được giải quyết. Cần phải phân biệt giữa năng lực mô hình và tính khả thi về mặt thương mại: hiệu ứng mô hình là sự hỗ trợ cơ bản, nhưng sự thành công hay thất bại của dự án phụ thuộc nhiều hơn vào việc bản thân mô hình kinh doanh có được thiết lập hay không. Trên một mô hình không hợp lệ, cho dù hiệu ứng mô hình tốt đến đâu thì cũng vô ích.
Trương Hạo Dương: Ông Lý chỉ ra điểm mấu chốt, đó là sự phù hợp giữa sản phẩm và công nghệ (TPF). Cá nhân tôi đã trải nghiệm ứng dụng các mô hình lớn trong bốn năm và cảm nhận lớn nhất của tôi là việc cải thiện nhanh chóng khả năng của mô hình đang dần loại bỏ lượng lớn công việc bẩn thỉu. Đội Ngũ cũng chia sẻ rằng sau khi khả năng của cơ sở mô hình được nâng cao, nhiều dự án từ ngữ nhắc nhở không còn cần thiết nữa và khả năng tuân thủ hướng dẫn, phản ánh và lập kế hoạch của nó đã được cải thiện đáng kể.
Cốt lõi của TPF là khi khả năng mô hình thấp hơn mức phân phối mong đợi của người dùng, khoảng cách cần được lấp đầy thủ công. Ngày nay, khả năng mô hình gần như vô hạn hoặc thậm chí vượt qua nhu cầu của người dùng và thách thức chuyển sang thiết kế kiến trúc và kiểm soát cấp cao hơn. Ví dụ, các công cụ lập trình AI hoạt động tốt ở cấp thực thi mã, nhưng vẫn có những thiếu sót trong thiết kế kiến trúc hệ thống.
Một vấn đề gai góc khác là cơ chế bộ nhớ. Ngay cả khi cửa sổ ngữ cảnh mở rộng lên hàng triệu mã thông báo, mô hình vẫn có các vấn đề như phân phối sự chú ý không đồng đều và quên thông tin đoạn giữa. Giải pháp tối ưu hiện tại vẫn là RAG và các biến thể của nó. Trong tương lai, nếu mô hình có thể tạo ra bước đột phá trong sắp xếp truy xuất (Xếp hạng lại) và khả năng bộ nhớ, nó sẽ đơn giản hóa đáng kể công việc tối ưu hóa cơ bản. Bất chấp những thách thức, tôi thường lạc quan thận trọng. Ngay cả khi mô hình được coi là "siêu thiên tài không có trí nhớ", giá trị của nó vẫn đủ đáng kể.
Li Chenzhong: Gần đây tôi đã suy nghĩ về một câu hỏi: Tại sao đôi khi các mô hình lại tạo ra những kết quả không mong đợi sau khi khả năng của chúng đã được cải thiện đáng kể? Tôi đã tìm ra một điểm chính - mô hình có thể không đủ thông minh, nhưng vì kiến thức sâu rộng của nó, nó có thể hình dung ra nhiều giải pháp khi đối diện một vấn đề, trong khi con người chúng ta bị giới hạn bởi kiến thức của chính mình và thường chỉ dự đoán được một hoặc một vài giải pháp. Khi mô hình đưa ra những ý tưởng mà chúng ta chưa lường trước được, chúng ta dễ cảm thấy thiên vị.
Gốc rễ của sự khác biệt này có thể nằm ở việc thiếu ràng buộc. Có những ràng buộc vô hình khi con người đưa ra quyết định: ranh giới kiến thức cá nhân và thông tin hoàn cảnh(hình ảnh, âm thanh, tín hiệu xã hội, v.v.) cùng nhau định hình con đường mong đợi. Tuy nhiên, mô hình chỉ dựa vào lời nhắc văn bản đầu vào và thiếu những ràng buộc tình huống tiềm ẩn này, điều này có thể dẫn đến đầu ra của các giải pháp có vẻ "lạ" nhưng tự nhất quán về mặt logic. Do đó, đôi khi cần phải cung cấp thêm các mô tả hoặc yêu cầu ràng buộc rõ ràng.
Ngay cả khi mô hình tiên tiến hơn trong tương lai, nếu sự bất đối xứng thông tin này không thể được giải quyết, vẫn sẽ có hai xu hướng: hoặc là quá phù hợp với một kịch bản cụ thể và mất đi tính linh hoạt, hoặc sử dụng các phương tiện kỹ thuật để mô phỏng thông tin ràng buộc ngầm mà con người nhận được. Đây là một vấn đề đáng chú ý trong tương tác mô hình hiện tại.
Zhang Haoyang: Điều này nhấn mạnh tầm quan trọng của năng lực đa phương thức.
Lý Thần Trung: Đúng vậy. Để mô hình khớp chính xác với kỳ vọng theo ngữ cảnh của người dùng, nó phải có được các chiều đầu vào tương tự như con người. Nếu không, giống như hai người đoán ý định của nhau, không thể tránh khỏi việc sẽ có độ lệch. Mô hình thậm chí còn khó khớp hoàn toàn với các kỳ vọng không nói ra. Đây sẽ là hướng cần khắc phục trong tương lai.
Xu Wenjian: Về bản chất, chúng ta cần độ sâu nhận thức của AI vào thế giới thực—thiết lập các kết nối chặt chẽ hơn về thị giác, thính giác, xúc giác và các chiều không gian khác. Chỉ bằng cách này, mô hình mới có thể hiểu và phản ứng với các điều kiện ngầm định trong các tình huống phức tạp.
Tiêu chuẩn về tài năng có đang được viết lại không?
Đối tượng: Loại tài năng cần thiết nhất để phát triển các sản phẩm LLM có thay đổi không? Bạn tìm kiếm loại người nào đầu tiên khi xây dựng đội ngũ?
Zhang Haoyang: Là một doanh nhân, cá nhân tôi trải nghiệm và thực hành quá trình chuyển đổi các hình thức tổ chức. Tôi hoàn toàn đồng ý với khái niệm "siêu cá nhân" - khi làm việc tại một công ty lớn, tôi đã cố gắng đóng nhân vật này và sử dụng AI độ sâu để hỗ trợ công việc của mình. Với sự cải thiện của khả năng Agent, giờ đây tôi làm việc như một đội ngũ nhân viên kỹ thuật số. Sau khi sử dụng các công cụ Agent và Cursor do chúng tôi tự phát triển, sản lượng mã hiệu quả trung bình của các kỹ sư trong đội ngũ đã tăng từ khoảng 1.500 dòng mỗi tuần lên 30.000 dòng, đạt được mức tăng gấp 20 lần về năng lực sản xuất.
Tôi cho rằng sự thay đổi này sẽ trở thành một hiện tượng phổ biến. Theo đó, cấu trúc tài năng chắc chắn sẽ thay đổi: các cá nhân cần chuyển đổi từ người thực hiện chiến thuật sang kiến trúc sư chiến lược. Năng lực cốt lõi của tương lai là quản lý - nhưng đối tượng quản lý sẽ thay đổi từ con người sang các tác nhân AI. Chìa khóa là học cách phân bổ nhiều nguồn lực năng lực khác nhau để giải quyết vấn đề: khi bạn có thể diễn đạt rõ ràng nhu cầu của mình và sử dụng khả năng ngày càng được nâng cao của Agent để làm theo hướng dẫn nhằm chia nhỏ nhiệm vụ phức tạp thành nhiệm vụ có thể thực hiện được, bạn có thể thúc đẩy đội ngũ Agent cộng tác hiệu quả.
Điều mà các Agent thiếu nhất hiện nay là khả năng kiến trúc toàn cầu. Họ giỏi giải quyết vấn đề ở những khía cạnh cụ thể, nhưng lại khó để họ có thể phối hợp giải pháp tổng thể. Do đó, điều cần thiết trong tương lai là những tài năng tổng hợp - họ không bắt buộc phải thành thạo mọi thứ, nhưng họ phải có tầm nhìn xuyên lĩnh vực và khả năng đặt câu hỏi chính xác. Lấy tôi làm ví dụ: là một kỹ sư trò chơi, mặc dù tôi chủ yếu giỏi về phát triển front-end, nhưng tôi hiểu kiến thức về phía máy chủ. Bằng cách hướng dẫn AI thông qua các câu hỏi chuyên môn và sử dụng kết quả kiểm tra của riêng tôi cùng khả năng tích hợp xuyên lĩnh vực, tôi có thể sử dụng Agent để hoàn thành toàn bộ công việc Chuỗi.
Tài năng truyền thống nhấn mạnh vào chuyên môn độ sâu trong các lĩnh vực dọc và đóng nhân vật chuyên gia hoặc người thực hiện trong các tổ chức lớn. Giá trị cốt lõi của tài năng tương lai nằm ở tầm nhìn rộng: ví dụ, các nhà phát triển hiểu được logic thiết kế, sản phẩm và nghệ thuật cùng một lúc. Những người như vậy với nhận thức liên miền và khả năng cộng tác với tác nhân sẽ trở thành những cá nhân siêu phàm thực sự.
Lý Thần Trung: Nhìn lại những ngày đầu của Internet, các lập trình viên xuất sắc thường có thể hoàn thành các dự án một cách độc lập và có khả năng toàn diện. Khi ngành công nghiệp mở rộng quy mô, phân công lao động (front-end, back-end, dữ liệu, thuật toán, v.v.) bắt đầu xuất hiện với mục tiêu cải thiện hiệu quả. Tuy nhiên, phân công lao động không nên được coi là nghề nghiệp. Tôi đặc biệt phản đối việc coi phân công lao động (chẳng hạn như "Tôi là back-end", "Tôi là front-end") là một nghề nghiệp, vì điều này có thể khiến các cá nhân mất khả năng hoàn thành nhiệm vụ vòng kín một cách độc lập.
Sự phát triển của AI đang đẩy nhanh quá trình quay trở lại bản chất này. Trong mô hình truyền thống, việc nhấn mạnh quá mức vào phân công lao động và chuyên môn hóa có thể làm suy yếu khả năng giải quyết vấn đề của cá nhân. Mặc dù AI không thể thay thế hoàn toàn con người trong việc xử lý mọi vấn đề phức tạp, nhưng nó đã hạ thấp đáng kể ngưỡng thực hiện. Cốt lõi của những tài năng trong tương lai sẽ là trở thành "kỹ sư AI" - điều này có nghĩa là bạn cần có hiểu biết cơ bản và khả năng vận hành trong toàn bộ quá trình đạt được mục tiêu hoặc sản phẩm. Sẽ rất khó để thích nghi với tương lai nếu bạn chỉ bám vào một tư duy phân công lao động duy nhất.
Khi khả năng AI được cải thiện, nhu cầu về các vị trí thực hiện cụ thể (như kỹ sư kiểm thử thuần túy) sẽ giảm. Điều quan trọng là: cần có người có khả năng lập kế hoạch sản phẩm trên toàn cầu - từ mô hình kinh doanh, định nghĩa sản phẩm đến lộ trình triển khai - và chỉ đạo hiệu quả các công cụ AI hoặc "nhân viên kỹ thuật số" để cộng tác và thực hiện. Những tài năng thiếu khả năng lập kế hoạch và tích hợp toàn cầu này và chỉ giỏi ở một liên kết kỹ thuật nhất định (như phát triển back-end hoặc thuật toán) sẽ phải đối mặt với những thách thức trong khả năng cạnh tranh của họ.
Do đó, trong việc tuyển chọn nhân tài, tôi coi trọng tiềm năng tiềm ẩn hơn: động lực nội tại mạnh mẽ, mong muốn khám phá, lòng dũng cảm và sự kiên trì để giải quyết vấn đề. Các kỹ năng kỹ thuật có thể được bồi dưỡng, nhưng khả năng tự tìm chủ đề, đào sâu nghiên cứu và tích hợp các nguồn lực để đạt được mục tiêu đối diện những lĩnh vực chưa biết là cốt lõi. Miễn là bạn có những phẩm chất cơ bản này và mức độ thông minh bình thường, chỉ là vấn đề thời gian trước khi bạn thành thạo các kỹ năng cấp cao cần thiết.
Khán giả: Triển vọng nghề nghiệp tương lai của trí tuệ nhân tạo là gì? Ngưỡng có cao không?
Lý Thần Trung: Câu hỏi đầu tiên là: Bạn có thực sự yêu thích lĩnh vực này không? Nếu bạn yêu thích nó, thì bạn không cần phải lo lắng quá nhiều về tương lai - bạn chắc chắn sẽ có thể vượt qua hầu hết mọi người trong lĩnh vực này và tự nhiên sẽ làm rất tốt. Nhưng nếu bạn không thực sự yêu thích nó, bạn sẽ phải cạnh tranh với hầu hết mọi người.
Trương Hạo Dương: Theo một dữ liệu gần đây tại Hoa Kỳ, ngành có tỷ lệ thất nghiệp cao nhất là khoa học máy tính, trái ngược hoàn toàn với sự kiện lớn của những người tốt nghiệp ngành này "đi ngang" hơn một thập kỷ trước. Theo một nghĩa nào đó, việc phát triển các mô hình lớn là biểu hiện của "lập trình viên giết lập trình viên": khi trí thông minh điều khiển máy móc của con người tiến hóa đến một giai đoạn mới, lượng lớn người hành nghề cấp thấp có thể phải đối mặt với rủi ro đào thải. Đặc biệt, AI đã có thể thay thế khả năng của các vị trí cấp thấp trong nhiều ngành công nghiệp.
Có một thực tế tàn khốc về triển vọng của sinh viên chuyên ngành trí tuệ nhân tạo: chỉ có 5% hoặc thậm chí những thiên tài cao hơn trong lĩnh vực này mới có khả năng cạnh tranh đáng kể. Bởi vì trong tương lai, bạn cần phải thông minh hơn AI để trở thành lực lượng cốt lõi thúc đẩy sự tiến hóa của AI. Khi khả năng của AI vượt qua nhiều năm hoặc thậm chí nhiều thập kỷ tích lũy chuyên môn của con người, nếu bạn không thể chuyển đổi thành một nhà quản lý tác nhân hoặc có tư duy liên ngành, bạn sẽ bị loại bỏ. AI sẽ không thay thế con người, nhưng những người có thể sử dụng AI sẽ thay thế những người không thể sử dụng AI. Ưu điểm của việc nghiên cứu trí tuệ nhân tạo là các lý thuyết có hệ thống có thể giúp bạn hiểu sâu hơn về bản chất của công nghệ. Chìa khóa là - trở thành một nhóm thiểu số hàng đầu trong lĩnh vực này hoặc trao quyền cho các khả năng của AI trong các lĩnh vực khác. Sự hiểu biết sâu sắc này sẽ giúp bạn tiến xa hơn những người khác.
Li Chenzhong: Tôi chia cộng đồng lập trình thành hai loại: lập trình viên (người sáng tạo có khả năng sáng tạo, tinh thần khám phá và khả năng tạo ra các khuôn khổ) và lập trình viên (công nhân cơ khí thực hiện nhiệm vụ lập trình). Trong kỷ nguyên AI, các lập trình viên hàng đầu vẫn có triển vọng rộng lớn; nhưng nhân vật kiểu lập trình viên sẽ nhanh chóng bị AI thay thế. Bởi vì mặc dù AI có tính sáng tạo, con người chỉ có thể duy trì giá trị của mình vượt qua AI trong các lĩnh vực sáng tạo mang tính đột phá hơn.
Xu Wenjian: Đừng giới hạn bản thân bởi những chi tiết kỹ thuật mà hãy mở rộng tầm nhìn, chủ động nắm bắt xu hướng mới, năng lực mới và chủ động thích ứng với những thay đổi của thời đại do AI thúc đẩy.
Bài viết này trích từ tài khoản công khai WeChat "InfoQ" (ID: infoqchina) , tác giả: AICon và được 36氪 cấp phép xuất bản.





