Viết bởi Zhang Yu Biên tập bởi Yang Boxheng
“Bắt kịp OpenAI” và “đo điểm chuẩn Open AI là mục tiêu của Zhipu AI kể từ khi thành lập” là những lời mà CEO Zhipu AI Zhang Peng đã nhắc đến nhiều lần khi chia sẻ với công chúng. bắt kịp với OpenAI rất nhiều.
Sau khi phát hành mẫu ngôn ngữ hàng đầu mới GPT-4o của OpenAI tại hội nghị mùa xuân, Google cũng đã ra mắt sê-ri"nhóm siêu gia đình AI" dựa trên Gemini tại Hội nghị nhà phát triển I/O. Mặc dù Zhipu AI được cho rằng là một trong những công ty mô hình quy mô lớn có nhiều khả năng trở thành "OpenAI của Trung Quốc" nhất, khi "Trận chiến hàng trăm mô hình" trong và ngoài nước ngày càng gay gắt, tình hình mà Zhipu AI đối diện khó có thể hài lòng.
Lấy trợ lý AI sáng tạo Zhipu Qingyan của Zhipu AI làm ví dụ. Đây là một sản phẩm mô hình lớn được phát triển dựa trên mô hình ngôn ngữ trí tuệ nhân tạo ChatGLM2. Nó được đào tạo trước với hàng nghìn tỷ ký tự văn bản và mã, kết hợp với tinh chỉnh có giám sát. công nghệ, với khả năng hỏi đáp chung, đối thoại nhiều vòng, viết sáng tạo, tạo mã, đối thoại ảo, vẽ AI, giải thích tài liệu và hình ảnh, v.v.
Tuy nhiên, so với ChatGPT do OpenAI phát triển dựa trên mô hình ngôn ngữ trí tuệ nhân tạo GPT-4 thì Zhipu Qingyan vẫn ở thế địa vị. Một trong những lỗ hổng trực tiếp nhất là ChatGLM2 kém hơn GPT-4 về dữ liệu đào tạo và tính đa dạng, khả năng đa ngôn ngữ, kích thước và tham số mô hình cũng như khả năng suy luận.
Để thu hẹp khoảng cách với OpenAI, Zhipu AI đã phát hành mô hình ngôn ngữ thế hệ mới GLM-4 tại Ngày hội mở công nghệ (Zhipu DevDay) đầu tiên được tổ chức vào tháng 1 năm 2024. Mặc dù hiệu suất tổng thể của GLM-4 đã được cải thiện rất nhiều so với thế hệ trước là 60%, được cho là “ngang bằng với GPT-4”, nhưng thực tế nó chỉ đạt khoảng 90% mức GPT-4.
Điều đáng nói là GPT-4o mới phát hành của OpenAI đã tăng tốc độ xử lý lên 200%. Dựa trên GPT-4o, OpenAI đã cập nhật nâng cấp ChatGPT, bổ sung thêm các chức năng giọng nói và hình ảnh mạnh mẽ hơn, giúp ChatGPT trở nên thực tế hơn. nâng cao - GPT-4o có thể phản hồi đầu vào âm thanh trong thời gian ngắn nhất là 0,23 giây và tốc độ phản hồi âm thanh đã đạt đến mức tương tự như con người.
Rõ ràng, việc bắt kịp GPT-4 hiện tại đã là nhiệm vụ cấp bách nhất của Zhipu AI. Liệu nó có thể đào tạo một mô hình ngôn ngữ thực sự sánh ngang với GPT-4 hay không là điều đặc biệt quan trọng đối với việc thương mại hóa và tiến bộ sinh thái.
01. Vẫn còn khoảng cách lớn với OpenAI
Zhipu AI được thành lập vào tháng 6 năm 2019. Nó được chuyển đổi từ những thành tựu kỹ thuật của Phòng thí nghiệm Kỹ thuật Tri thức (KEG) của Đại học Thanh Hoa. Đây hiện là doanh nghiệp mô hình lớn tự phát triển và sở hữu hoàn toàn trong nước duy nhất ở Trung Quốc. Nó đã bắt đầu đào tạo trước GLM. kiến trúc sớm nhất là vào năm 2020. nghiên cứu và phát triển, và đào tạo mô hình tham số 10 tỷ GLM-10B vào năm 2022, họ đã cùng nhau phát triển mô hình chung đào tạo trước quy mô cực lớn 130 tỷ cấp độ GLM-130B vào năm 2023, Zhipu; AI đã ra mắt sê-ri 100 tỷ mô hình đối thoại cơ sở mã nguồn mở và ra mắt GLM-4 vào tháng 1 năm 2024.
Bởi vì Zhipu AI gia nhập thị trường sớm và được đánh giá trực tiếp so với OpenAI nên nó đã trở thành con cưng của các tổ chức vốn. Từ tháng 7 đến tháng 9 năm 2023, Zhipu AI đã nhận được tổng cộng 5 vòng tài trợ, với số tiền tài trợ hơn 2,5 tỷ nhân dân tệ. Các tổ chức đầu tư chính bao gồm Quỹ đổi mới độc lập Zhongguancun, Phòng đầu tư chiến lược Meituan, Ant Group, Alibaba, Tencent Investment. , Gao Ling Capital, Sequoia Capital, v.v., mức định giá hiện tại đã lên tới 20 tỷ nhân dân tệ, khiến nó trở thành một trong những công ty “kỳ lân” trong lĩnh vực AI trong nước.
Tuy nhiên, vẫn còn khoảng cách lớn giữa Zhipu AI và OpenAI.
Từ góc độ kỹ thuật, OpenAI chú ý hơn đến tính linh hoạt, tính di động và mở rộng. Các mô hình ngôn ngữ sê-ri GPT của nó có thể được áp dụng trong nhiều tình huống và có khả năng tùy biến cao. Ngược lại, lộ trình kỹ thuật của Zhipu AI là "mô hình lớn + mô hình nhỏ", thông qua đào tạo trước và tinh chỉnh các mô hình lớn để thích ứng với nhu cầu của các tình huống và nhiệm vụ khác nhau. Lộ trình kỹ thuật này có thể cải thiện khả năng khái quát hóa và phạm vi ứng dụng của mô hình, nhưng nó cũng có những vấn đề như độ phức tạp của mô hình cao, khối lượng tính toán lớn và thời gian đào tạo dài.
Về quy mô mô hình, các mô hình ngôn ngữ sê-ri GPT của OpenAI có quy mô lớn hơn và có thể xử lý lượng lớn dữ liệu ngôn ngữ tự nhiên, từ đó đạt được hiệu suất mô hình tốt hơn, trong khi quy mô mô hình của Zhipu AI có thể nhỏ hơn và có khả năng xử lý dữ liệu hạn chế. ảnh hưởng đến hiệu suất mô hình và khả năng khái quát hóa của nó; về mặt tài nguyên dữ liệu, OpenAI có lượng lớn tài nguyên dữ liệu ngôn ngữ tự nhiên có thể được sử dụng để đào tạo và tối ưu hóa mô hình của nó, trong khi Zhipu AI có thể có tương đối ít tài nguyên dữ liệu, dẫn đến sự thất bại của đào tạo mô hình của nó có hiệu lực và hiệu suất bị hạn chế.
Sự khác biệt trực tiếp giữa hai điều này được phản ánh ở số lượng người dùng. Vào tháng 11 năm 2022, số lượng người dùng ChatGPT của OpenAI đã vượt quá một triệu chỉ sau 5 ngày ra mắt . Vào tháng 1 năm 2023, số lượng người dùng hoạt động hàng tháng của nó đã vượt quá 100 triệu, khiến nó trở thành ứng dụng tiêu dùng tăng trưởng nhanh nhất trong lịch sử . Ngược lại, theo ước tính của cơ quan, tính đến tháng 11 năm 2023, số lượng người dùng hoạt động hàng ngày của Zhipu Qingyan, một công ty con của Zhipu AI, chỉ dao động từ 100.000 đến 400.000.
Điều đáng nói là Zhipu Qingyan thậm chí không phải là đối thủ của Wenxinyiyan, một công ty con của Baidu. Tính đến tháng 11 năm 2023, Wenxinyiyan có khoảng 800.000 người dùng hoạt động hàng ngày và tính đến tháng 4 năm 2024, Wenxinyiyan số lượng người dùng Xinyiyan đã vượt quá 200 triệu. .
Zhang Peng cũng thẳng thắn cho biết, so với các mô hình lớn của nước ngoài, việc phát triển các mô hình lớn trong nước bắt đầu muộn hơn. Cùng với những hạn chế về tỷ lệ băm hiệu năng cao và khoảng cách về chất lượng dữ liệu, các mô hình lớn trong nước ngang bằng với trình độ tiên tiến của thế giới. về quy mô và năng lực cốt lõi Có một khoảng cách nhất định, đó là khoảng một năm.
02. Zhipu AI còn một chặng đường dài để thương mại hóa
Làm thế nào để thương mại hóa các mô hình lớn là một thách thức lớn đối với tất cả các công ty mô hình lớn, bao gồm cả Zhipu AI.
Zhipu AI là một trong những công ty mô hình lớn sớm nhất ở Trung Quốc thúc đẩy thương mại hóa và là công ty đầu tiên đề xuất lộ trình triển khai "Mô hình như một dịch vụ (MaaS)". Hiện tại, Zhipu AI đã khám phá bốn mô hình kinh doanh: một là nhẹ, một là mô hình nhẹ. Đóng gói các mô hình lớn vào một nền tảng mở, cung cấp API (giao diện lập trình ứng dụng) cho các nhà phát triển, doanh nghiệp, v.v. để thực hiện cuộc gọi và trả tiền theo số lượng cuộc gọi. Phương thức này rất đơn giản và thuần thục, không khác nhiều so với nước ngoài. thứ hai, nó hướng đến một số quốc gia. Đối với nhu cầu của các doanh nghiệp vừa và lớn về bảo mật dữ liệu, Zhipu AI cung cấp giải pháp triển khai sở hữu tư nhân tảng đám mây và giúp người dùng mở ra một khu vực mô hình đặc biệt dựa trên tỷ lệ băm đám mây; thứ ba là sở hữu tư nhân hoàn toàn; triển khai, trên nền tảng phần cứng và tỷ lệ băm của chính công ty. Nó cung cấp khả năng cơ bản của các mô hình lớn để đáp ứng nhu cầu của doanh nghiệp trong việc phát triển các ứng dụng liên quan và phát triển việc kinh doanh; thứ tư là giải pháp kết hợp phần mềm và phần cứng, thích ứng và ràng buộc các mô hình lớn để bản địa hóa; Phần cứng Xinchuang, có thể loại bỏ nhu cầu phát triển trong hoàn cảnh khách hàng. Quá trình triển khai và triển khai gỡ lỗi, bán hàng và triển khai thông qua tích hợp phần mềm và phần cứng.
Zhang Peng cho rằng rằng mức độ sẵn sàng chi trả của bên B tốt hơn nhiều so với bên C, đặc biệt là các công ty hàng đầu trong ngành thường đầu tư nhiều hơn vào các mô hình lớn và di chuyển nhanh chóng. Vì vậy, Zhipu AI ngay từ đầu đã nhắm đến bên B. Tính đến năm 2023, Zhipu AI có hơn 2.000 đối tác sinh thái và hơn 1.000 ứng dụng mô hình quy mô lớn. Hơn 200 công ty đã tiến hành đồng sáng tạo độ sâu với Zhipu AI, bao gồm truyền thông, tư vấn, tiêu dùng, tài chính, Nhiều công ty hàng đầu. trong năng lượng mới, Internet, văn phòng thông minh và các lĩnh vực khác. Zhang Peng tiết lộ rằng vào nửa cuối năm 2023, Zhipu AI sẽ có hàng trăm khách hàng ký đơn hàng và đến năm 2023, tổng số tiền ký kết sẽ là hơn 100 triệu.
Tuy nhiên, trước khi Zhipu AI được thương mại hóa, một “cuộc chiến giá cả” đã bắt đầu trong ngành công nghiệp mô hình lớn.
Vào ngày 15 tháng 5, Bytedance thông báo rằng mẫu chính của Doubao (Doubao Universal Model Pro) có giá 0,0008 nhân dân tệ/nghìn Token trên thị trường doanh nghiệp, trong khi giá của các mẫu có cùng thông số kỹ thuật trên thị trường thường là 0,12 nhân dân tệ/nghìn Token . Đó là mô hình Doubao có giá gấp 150 lần. Vào ngày 14 tháng 5, OpenAI đã thông báo tại hội nghị mùa xuân rằng giá API của GPT-4o giảm 50%.
Trước đó, công ty AI Mistral AI của Pháp đã phát hành mẫu lớn mới nhất của mình, Mistral Large, và ra mắt Le Chat, robot trò chuyện đầu tiên đánh giá ChatGPT. Về giá cả, giá đầu vào và đầu ra của Mistral Large rẻ hơn khoảng 20% so với GPT-4 Turbo; giá API của DeepSeek-V2, mẫu lớn MoE thế hệ thứ hai mới do DeepSeek, một công ty AI trực thuộc Magic Square phát hành; Định lượng, là 1 đầu vào trên một triệu Token, đầu ra là 2 Yuan (bối cảnh 32K), giá gần bằng 1% của GPT-4 Turbo.
Đối diện“cuộc chiến giá cả”, Zhipu AI cũng thông báo rằng giá mua lại của sản phẩm cấp nhập cảnh mẫu GLM-3 Turbo sẽ giảm từ 5 nhân dân tệ/triệu Token xuống còn 1 nhân dân tệ/triệu Token, giảm tới 1 nhân dân tệ/triệu Token. 80%.
Điều đáng nói là việc các mẫu lớn tiếp tục giảm giá dự kiến sẽ dẫn đến quá trình thương mại hóa nhanh hơn, nhưng đồng thời, "cuộc chiến về giá" thường có nghĩa là các công ty cần phải nhượng bộ về giá. Đối với Zhipu AI, khả năng sinh lời của chính nó. bị hạn chế. Nếu chúng ta tiếp tục tham gia vào cuộc “chiến tranh giá cả”, lợi nhuận có thể giảm sâu hơn và việc đạt được lợi nhuận sẽ trở nên khó khăn hơn.
Zhang Peng cũng thừa nhận những thách thức mà Zhipu AI phải đối mặt vào năm 2024 là rất khó khăn. Một mặt, công nghệ siêu nhận thức và siêu liên kết của OpenAI sẽ đạt được những đột phá mới vào năm 2024, đòi hỏi Zhipu AI phải liên tục đi theo công nghệ hàng đầu thế giới. mặt khác, các mô hình lớn sẽ mở ra làn sóng thương mại hóa vào năm 2024, đồng thời áp lực cạnh tranh thương mại hóa của Zhipu AI cũng sẽ tăng lên.
Đối với Zhipu AI, con đường thương mại hóa hiện tại tương đối rõ ràng, nhưng mấu chốt để liệu nó có thể đi theo con đường thương mại hóa các mô hình lớn không chỉ nằm ở việc khám phá các mô hình kinh doanh mà còn ở việc giải quyết các vấn đề tiềm ẩn trong quá trình phát triển các mô hình lớn.
03. Ôm nhau cho ấm áp
Mã nguồn mở mở cũng là một tính năng chính của Zhipu AI hy vọng sẽ tạo ra một cộng đồng và hệ sinh thái thịnh vượng nhằm thúc đẩy hơn nữa sự phát triển của các cộng đồng mã nguồn mở kiểu mẫu lớn.
Zhang Peng từng nhận định Zhipu AI là một trong số ít công ty công nghệ hàng đầu Trung Quốc có thể cạnh tranh với OpenAI. Công ty hy vọng có thể hợp tác cùng với tất cả những người tham gia trong lĩnh vực AI, bao gồm các đối tác thượng nguồn và hạ nguồn trong Chuỗi ngành, cộng đồng nhà phát triển và giới học thuật, để đóng góp nỗ lực của mình cho tương lai AI mới của Trung Quốc.
Vào năm 2024, Zhipu AI sẽ ra mắt một quỹ mã nguồn mở mở mô hình lớn mã nguồn mở. Kế hoạch bao gồm ba "1000": Zhipu AI sẽ cung cấp 1.000 thẻ máy tính cho cộng đồng mã nguồn mở mô hình lớn để giúp phát triển mã nguồn mở mở; Được sử dụng để hỗ trợ các dự án mã nguồn mở liên quan đến các mô hình lớn; cung cấp 100 tỷ mã thông báo API miễn phí cho các nhà phát triển mã nguồn mở xuất sắc. Zhang Peng cho biết mục đích của Quỹ mã nguồn mở mô hình lớn là thúc đẩy tiến bộ vượt bậc trong nghiên cứu và phát triển mô hình lớn, đồng thời thúc đẩy sự thịnh vượng của toàn bộ hệ sinh thái mã nguồn mở của các mô hình lớn.
Đối diện các doanh nhân mô hình lớn toàn cầu, Zhipu AI sẽ nâng cấp"Kế hoạch Z" và ra mắt một quỹ khởi nghiệp mô hình lớn với tổng trị giá 1 tỷ nhân dân tệ cùng với các đối tác sinh thái để hỗ trợ sự đổi mới ban đầu của các mô hình lớn, bao gồm các thuật toán mô hình lớn, các nhà khai thác cơ bản và tối ưu hóa chip, mô hình lớn trong ngành và siêu ứng dụng.
Ngoài ra, Zhipu AI cũng đã đầu tư vào nhiều công ty Chuỗi ngành AI. Tính đến thời điểm hiện tại, Zhipu AI đã đầu tư và đầu tư vào hơn 10 công ty khởi nghiệp thông qua đầu tư công nghiệp, với quy mô đầu tư duy nhất là 1 triệu nhân dân tệ, trong đó AI. models. "Lingxin Intelligence" là một doanh nghiệp lớp, "Wall-Facing Intelligence" là một doanh nghiệp lớp mô hình AI, "Power Law Intelligence" là nhà cung cấp sản phẩm dịch vụ pháp lý thông minh, "Zhiyibi" là một nền tảng dịch vụ mô hình doanh nghiệp lớn và " Sudaozhi" là nhà cung cấp dịch vụ phần mềm và công nghệ thông tin. "Tính toán", nhà cung cấp ứng dụng AI tổng quát "Công nghệ Shengshu", v.v.
Zhang Peng rất lạc quan về tương lai của Zhipu AI "Vào năm 2024, thị trường mô hình lớn sẽ trở lại bình lặng sau sự tăng trưởng man rợ. Đầu tư và cường điệu hóa vào các mô hình lớn sẽ chấm dứt và trọng tâm của ngành sẽ chuyển từ mô hình sang mô hình." Tuy nhiên, điều này không có nghĩa là tốc độ phát triển công nghệ của các mô hình lớn sẽ giảm và mức trần cho việc khám phá đi lên còn lâu mới đạt được.”
Bài viết này xuất phát từ tài khoản công khai WeChat "DoNews" (ID: ilovedonews) , tác giả: Zhang Yu, 36 Krypton được xuất bản với sự cho phép.





