Từ những đột phá công nghệ đến các ứng dụng thương mại, ngành công nghiệp robot đang sẵn sàng cho một làn sóng tăng trưởng bùng nổ mới. Được thúc đẩy bởi vốn, chính sách và các kịch bản ứng dụng khác nhau, liệu robot đã mở ra "thời khắc ChatGPT"? Thiết kế robot hình người là một điều cần thiết hay một lựa chọn?
Đằng sau những vấn đề này, dữ liệu kinh tế vĩ mô cung cấp một số tham khảo ngành.
Vào tháng 7 năm nay, IDC dự đoán thị trường robot toàn cầu sẽ vượt mốc 400 tỷ đô la vào năm 2029, trong đó Trung Quốc chiếm gần một nửa. Trong khi đó, bán ra trên toàn cầu đã vượt mốc 100.000 chiếc vào năm 2024, trong đó robot giao hàng và robot vệ sinh dẫn đầu với thị phần lần lượt là 38,4% và 33,3%. Các nhà sản xuất Trung Quốc chiếm tỷ lệ 84,7% bán ra trong lĩnh vực này.
Về thị trường robot hình người, IDC dự đoán lượng robot hình người thương mại bán ra tại Trung Quốc sẽ đạt khoảng 5.000 chiếc vào năm 2025, tăng lên gần 60.000 chiếc vào năm 2030, với tăng trưởng kép hàng năm vượt quá 95%. Mọi dấu hiệu đều cho thấy thị trường robot đang mở rộng nhanh chóng, được thúc đẩy bởi các yếu tố từ tình trạng thiếu hụt lao động đến đổi mới công nghệ.
Trong sự kiện ROSCon China 2025, các phóng viên của Jiemian News đã trò chuyện với một số chuyên gia trong ngành về nhiều chủ đề khác nhau để thảo luận về một số vấn đề rất được quan tâm trong lĩnh vực robot.
Chủ đề 1: Khi nào trí thông minh hiện thân sẽ mở ra thời điểm ChatGPT của riêng nó?
Một số chuyên gia trong ngành có quan điểm khác nhau về thời điểm ChatGPT của trí thông minh hiện thân.
Hu Chunxu, Phó chủ tịch Hệ sinh thái nhà phát triển tại Digua Robotics, chia sẻ với Jiemian News rằng ông hoàn toàn tin tưởng vào tương lai của trí tuệ nhân tạo và ngành công nghiệp robot.
"Xét từ góc độ mô hình quy mô lớn và sự phát triển do AI thúc đẩy, chúng ta đang bước vào kỷ nguyên trí tuệ nhân tạo, và robot chắc chắn sẽ được AI định hình lại. Tôi rất lạc quan về sự phát triển của robot hiện thân và tin chắc rằng robot sẽ được triển khai trên quy mô lớn trong tương lai." Mặc dù ông cũng thừa nhận rằng hiện tại đang tồn tại vấn đề thiếu tính linh hoạt, "Một robot có thể hoạt động tốt trong một tình huống, nhưng tỷ lệ hỏng hóc của nó có thể tăng vọt trong một tình huống khác." Nhưng theo quan điểm của ông, đây là một quá trình tất yếu.
Tan Weijia, Tổng Thư ký Hiệp hội Robot Thâm Quyến, cũng chỉ ra rằng tỷ lệ thâm nhập của robot vẫn rất thấp trong thập kỷ qua, "chỉ ở mức một chữ số", bởi vì mỗi ứng dụng mới đều đòi hỏi chi phí phát triển lần tốn kém, gây khó khăn cho các công ty. Tuy nhiên, trí tuệ nhân tạo đã mang lại sức sống mới cho ngành công nghiệp này, rút ngắn chu kỳ phát triển và triển khai, đồng thời cho phép cải thiện hiệu suất cơ bản hơn bằng cách sử dụng các thuật toán AI.
Bà cho rằng rằng trí thông minh hiện thân có thể tạo ra các hiện tượng mới nổi tương tự như ChatGPT, hoặc có thể đầu tiên tích lũy dữ liệu trong các tình huống cụ thể và sau đó tạo ra các cơ hội giá trị kinh doanh "trong quá trình đó".
Ngược lại, có một số tiếng nói biện chứng.
Trong một cuộc phỏng vấn với Jiemian News, Shi Fengming, giám đốc việc kinh doanh công nghệ tại FEXI, cảnh báo rằng mặc dù trí tuệ nhân tạo hiện thân là một trong những con đường tiềm năng để đạt được trí tuệ nhân tạo tổng quát, nhưng những trở ngại về công nghệ và khó khăn thương mại là có thật. "Chúng ta nên thận trọng ứng xử những lời thổi phồng quá mức trong ngắn hạn, nhưng vẫn nên lạc quan một cách lý trí về lâu dài."
Ông nhấn mạnh rằng điều quan trọng hơn là phải giải quyết vấn đề cơ bản về cách "trí thông minh" có thể tương tác hiệu quả và đáng tin cậy với thế giới vật chất thực tế.
Vậy, với chính sách và sự quan tâm đầu tư, liệu điều này có nghĩa là chúng ta đang "chờ đợi một bước ngoặt"? Nhiều người trong ngành được Jiemian News phỏng vấn có xu hướng quan điểm đang "nở rộ trên con đường phát triển".
Yao Jiajun, một học giả thỉnh giảng tại Khoa Khoa học và Công nghệ Thông tin thuộc Đại học Vùng Vịnh Lớn, cho rằng"lạc quan dài hạn" và "thực dụng ngắn hạn" nên được theo đuổi song song: Một mặt, một bước đột phá thực sự trong trí tuệ hiện thân đòi hỏi phải tái cấu trúc kiến trúc nền tảng. VLA chính thống hiện nay có sự kết hợp chặt chẽ giữa luồng thông tin và luồng điều khiển, và thiết kế của nó tương đối đơn giản. Cùng với những hạn chế về giao tiếp ontology và tỷ lệ băm, việc duy trì khả năng khái quát hóa ổn định trong hoàn cảnh không chuẩn là rất khó khăn. Mặt khác, bản thân việc thu thập dữ liệu thực cũng gặp phải sự kháng cự của yếu tố con người.
Yao Jiajun cho biết: "Do đó, thay vì theo đuổi robot đa năng ngay từ đầu, tốt hơn hết là nên triển khai robot 'toàn cảnh' ở những vị trí làm việc khó tuyển dụng và rủi ro cao, bắt đầu bằng các ví dụ cụ thể và dần lắng đọng dữ liệu có giá trị cao và bí quyết xử lý trong quá trình này".
Chủ đề 2: Hình dạng người – hình dạng cần thiết hay là lựa chọn tùy chọn?
Tương lai của robot hình người đã là chủ đề tranh luận trong ngành. Một phân tích của McKinsey công bố vào tháng 6 năm nay chỉ ra rằng robot đa năng có nhiều hình dạng khác nhau và không nhất thiết phải bắt chước con người, nhưng hình dạng của robot hình người có lợi thế trong việc thích nghi với hoàn cảnh hiện có. Chúng có thể di chuyển trong không gian được thiết kế cho con người mà không cần phải thay đổi quy mô lớn hoàn cảnh làm việc, đây là một điểm bán hàng độc đáo của robot hình người.
Tuy nhiên, xét về ứng dụng công nghiệp, con đường thương mại hóa hiện nay linh hoạt và đa dạng hơn. Liu Yizhang, Trưởng bộ phận Kinh doanh Sáng tạo Thể hiện của Trung tâm Đổi mới Robot Hình người Bắc Kinh, cho biết thị trường robot hình người trong nước vẫn còn sơ khai, với doanh số chỉ vài trăm chiếc vào năm ngoái, và ước tính sẽ tăng lên khoảng 20.000 chiếc trong năm nay. "Hầu hết các robot này đang được triển khai trong nghiên cứu khoa học và giáo dục, và việc chúng thực sự được đưa vào các lĩnh vực công nghiệp hoặc dịch vụ vẫn đang được xác minh."
Echo, một chuyên gia về công nghệ nhận thức và hệ thống tự động tại Trung tâm Đổi mới Robot Hình người Hợp tác Quốc gia-Địa phương, cũng đề xuất rằng không cần phải vội vàng áp dụng nó cho tất cả các kịch bản cùng một lúc. Thay vào đó, nên giống như sự phát triển của Internet và công nghệ hàng không vũ trụ, trước tiên hãy đầu tư vào một số kịch bản đặc biệt được hỗ trợ ở cấp quốc gia, tích lũy kinh nghiệm trước khi triển khai.
ZhiNeng Smart Chip, phân tích từ góc độ ứng dụng có cấu trúc, chỉ ra rằng các kịch bản phi cấu trúc như chăm sóc tại nhà đặt ra những thách thức kỹ thuật đáng kể, và trong ngắn hạn, nên bắt đầu với các kịch bản bán cấu trúc và chuyển đổi dần dần. Bà cũng đề cập đến mô hình Robot như một Dịch vụ (RaaS), có thể hạ thấp ngưỡng đầu tư ban đầu, cho phép các công ty dùng thử trước khi mở rộng.
Nhìn chung, ngành công nghiệp này thường ưu tiên phương pháp tiếp cận theo từng tình huống cụ thể. Robot hình người không phải là thiết yếu cho mọi ứng dụng, nhưng chúng có lợi thế tự nhiên khi tích hợp liền mạch vào hoàn cảnh sống của con người. Các giải pháp thay thế có thể bao gồm việc thích ứng với hoàn cảnh hoặc lựa chọn các giải pháp nền tảng khác.
Chủ đề 3: Chi phí và kịch bản, Làm thế nào để đạt được ROI?
Việc robot có thực sự thâm nhập thị trường hay không phụ thuộc rất nhiều vào sự phù hợp giữa chi phí và ứng dụng. Mặc dù triển vọng thị trường đầy hứa hẹn, tỷ lệ thâm nhập thực tế của robot vẫn còn rất thấp.
Tan Weijia chỉ ra rằng tỷ lệ thâm nhập của robot trong ngành sản xuất chỉ ở mức một chữ số, và ngay cả trong lĩnh vực hỗ trợ thông minh cũng chưa có nhiều đột phá đáng kể. Lý do là vì mỗi kịch bản mới đều đòi hỏi chi phí phát triển và triển khai lần rất tốn kém.
Trên thực tế, các công ty cần xác định rõ ROI trước khi triển khai trên diện rộng. Nếu không, ngay cả khi thiết bị có thể hoạt động 24/7, việc thu hồi chi phí sẽ rất khó khăn nếu hiệu suất không đạt kỳ vọng. Điều này đòi hỏi các nhà sản xuất phải tối ưu hóa cấu hình theo yêu cầu của kịch bản.
Yao Jiajun chỉ ra thêm rằng trong các tình huống không chuẩn như hàn, công nhân thường ngại thu thập dữ liệu vì lo sợ bị thay thế. Ông cho rằng rằng thay vì theo đuổi một robot vạn năng có thể triển khai đồng loạt, tốt hơn hết là nên đạt được tính phổ cập trong một số lĩnh vực cụ thể có rủi ro cao hoặc khó khăn về lao động, dần dần thúc đẩy ứng dụng công nghệ và lợi ích của nó.
Gu Qiang, người đồng sáng lập Guyueju, đã đưa ra phép so sánh với lịch sử của ngành công nghiệp điện thoại di động, cho rằng khi sản xuất hàng loạt và công nghệ phát triển, chi phí cho robot cuối cùng sẽ giảm, nhưng hiện tại, trọng tâm chính nên là các kịch bản ứng dụng hiệu quả.
Lưu Yizhang nhấn mạnh rằng giá trị thực sự của robot hình người đến từ giá trị gia tăng của "cảm xúc và dịch vụ", chứ không chỉ là chi phí phần cứng. Ông chỉ ra rằng nhiều công ty hiện đang tham gia vào cuộc chiến giá cả để giành đơn hàng, với mức giá gần như thua lỗ. "Những cuộc đấu đá nội bộ như vậy gây bất lợi cho sự phát triển lành mạnh của ngành."
Một số người trong ngành thường đồng ý rằng trước khi chốt giá, robot cần chứng minh rằng chúng có thể giải quyết vấn đề và có những trường hợp sử dụng thực tế trước khi thảo luận về việc giảm giá.
Chủ đề 4: Làm thế nào để giải quyết những hạn chế dữ liệu và tiêu chuẩn?
Những hạn chế trong việc thu thập dữ liệu và chuẩn hóa từ lâu đã hạn chế sự phát triển của robot.
Hồ Xuân Húc thẳng thắn nói rằng ngành công nghiệp vẫn chưa hình thành một tiêu chuẩn thu thập dữ liệu thống nhất, và mỗi công ty có các tiêu chuẩn khác nhau để thu thập dữ liệu đa phương thức như thị giác, ngôn ngữ và phản hồi lực. Việc thiếu một tiêu chuẩn thống nhất đồng nghĩa với việc dữ liệu hiện có chủ yếu là dữ liệu bẩn với chất lượng không đồng nhất, gây khó khăn cho việc cung cấp dữ liệu trực tiếp cho các mô hình như VLA.
Ông chỉ ra rằng so với xe tự lái, robot thiếu một lượng lớn mẫu dữ liệu. "Hàng chục triệu xe ô tô trên đường có thể tạo ra một lượng lớn dữ liệu thực, nhưng lại không có nhiều mẫu như vậy trong các tình huống robot. Vấn đề dữ liệu là điểm khó khăn lớn nhất."
Tương tự, Tan Weijia cũng đề cập rằng việc chỉ dựa vào một cấu hình robot duy nhất để thu thập dữ liệu trước đây là không hiệu quả, và việc di chuyển sang các cấu trúc khác đòi hỏi lượng lớn công việc lặp đi lặp lại. Cần thiết lập một phương pháp chung hoặc mô hình thế giới để đạt được khả năng di chuyển đa nền tảng.
Về mặt tiêu chuẩn hóa, ngành công nghiệp này vẫn đang trong giai đoạn đầu. Liu Yizhang tiết lộ rằng hiện tại vẫn chưa có sự đồng thuận về bất kỳ vấn đề nào liên quan đến robot hình người, từ quy trình sản xuất và tiêu chuẩn thử nghiệm đến chỉ báo hiệu suất và thậm chí cả giao diện cho các thành phần chính. Ví dụ, chưa có tiêu chuẩn thống nhất về mức độ an toàn chuyển động được chấp nhận hoặc cách đánh giá độ tin cậy và độ bền của robot. Việc thiếu tiêu chuẩn đồng nghĩa với việc mỗi công ty hoạt động độc lập, gây khó khăn cho việc quảng bá trên quy mô lớn.
Hơn nữa, các công ty còn thận trọng trong việc chia sẻ dữ liệu. Các nhà sản xuất cảm biến và công ty thuật toán lo ngại rằng dữ liệu cốt lõi sẽ trở thành bí mật thương mại của họ và không muốn tiết lộ dễ dàng. Một số chuyên gia trong ngành cũng bày tỏ quan điểm tương tự với Jiemian News: một tổ chức hoặc quốc gia đơn lẻ khó có thể giải quyết những vấn đề này; cần có một nền tảng và hệ sinh thái mã nguồn mở cởi mở hơn để cùng nhau phát triển các tiêu chuẩn.
Theo nhiều quan điểm trong ngành, mặc dù trí tuệ nhân tạo nói chung là mục tiêu cuối cùng, nhưng con đường triển khai nó trong công nghiệp có thể giống như "đẻ trứng dọc đường" trong các tình huống thực tế. Chỉ bằng cách tích lũy dữ liệu dần dần, tối ưu hóa mô hình và giảm chi phí, năng suất và tiềm năng cuộc sống mới có thể được giải phóng hoàn toàn.
Bài viết này được trích từ "Tin tức Jiemian" , do Xu Meihui biên soạn và được xuất bản với sự cho phép của 36Kr.




