OpenAI, muốn huy động 6,5 tỷ USD, phát hành mô hình o1 khi nó còn nóng. Tìm hiểu 10 điểm chính trong bài viết này.

avatar
TechFlow
2 ngày trước
Bài viết này được dịch máy
Xem bản gốc
o1 có thể đại diện cho thế hệ mô hình lớn tiếp theo của OpenAI.

Nguồn: Forbes

Biên soạn bởi: MetaverseHub

Tuần trước, có thông tin cho rằng OpenAI đã nhận được 6,5 tỷ USD trong vòng tài trợ mới và giá trị thị trường của nó cũng đã đạt 150 tỷ USD .

Khoản tài trợ này tái khẳng định giá trị to lớn của OpenAI với tư cách là một công ty khởi nghiệp về trí tuệ nhân tạo và cũng thể hiện sự sẵn sàng thực hiện các thay đổi về cấu trúc để thu hút nhiều đầu tư hơn.

Các nguồn tin cho biết thêm, vòng cấp vốn khổng lồ được các nhà đầu tư săn đón mạnh mẽ do thu nhập của OpenAI tăng trưởng nhanh chóng và có thể hoàn tất trong vòng hai tuần tới.

Các nhà đầu tư hiện tại bao gồm Thrive Capital, Khosla Ventures và Microsoft dự kiến ​​sẽ tham gia. Các nhà đầu tư mới bao gồm Nvidia và Apple cũng có kế hoạch đầu tư, và Sequoia Capital cũng đang đàm phán để quay lại đầu tư .

Đồng thời, OpenAI đã ra mắt sê-ri o1, mô hình trí tuệ nhân tạo phức tạp nhất cho đến nay, được thiết kế để vượt trội trong nhiệm vụ giải quyết vấn đề và suy luận phức tạp. Mô hình o1 sử dụng phương pháp học tăng cường và lý luận Chuỗi suy nghĩ, thể hiện sự tiến bộ lớn về khả năng trí tuệ nhân tạo.

OpenAI cung cấp các mô hình o1 cho người dùng và nhà phát triển ChatGPT thông qua các cấp độ truy cập khác nhau . Đối với người dùng ChatGPT, người dùng gói ChatGPT Plus có quyền truy cập vào mô hình xem trước o1, mô hình này có khả năng lý luận và giải quyết vấn đề nâng cao.

Giao diện lập trình ứng dụng (API) của OpenAI cho phép các nhà phát triển truy cập o1-preview và o1-mini trên các gói đăng ký cấp cao hơn.

Các mô hình này được cung cấp trong API cấp 5, cho phép các nhà phát triển tích hợp các tính năng nâng cao của mô hình o1 vào ứng dụng của riêng họ. API cấp 5 là gói đăng ký cấp cao hơn do OpenAI cung cấp để truy cập các mô hình nâng cao của nó.

Dưới đây là 10 điểm chính về mô hình OpenAI o1:

01. Hai mẫu mã: o1-Preview và o1-Mini

OpenAI đã phát hành hai biến thể: o1-preview và o1-mini. Mô hình xem trước o1 vượt trội trong nhiệm vụ phức tạp, trong khi o1-mini cung cấp giải pháp tối ưu hóa nhanh hơn, tiết kiệm chi phí hơn cho các lĩnh vực STEM, đặc biệt là mã hóa và toán học.

02. Lý luận Chuỗi tư duy nâng cao

Mô hình o1 sử dụng quy trình Chuỗi suy nghĩ, suy luận từng bước trước khi đưa ra câu trả lời . Phương pháp chu đáo này cải thiện độ chính xác và giúp xử lý các vấn đề phức tạp đòi hỏi lý luận nhiều bước, khiến nó vượt trội hơn so với các mô hình trước đó như GPT-4.

Chuỗi tư duy nhắc nhở nâng cao khả năng suy luận của trí tuệ nhân tạo bằng cách phân tách các vấn đề phức tạp thành các bước liên tiếp, từ đó cải thiện khả năng tính toán và logic của mô hình.

Mô hình GPT-o1 của OpenAI thúc đẩy quá trình này bằng cách nhúng nó vào kiến ​​trúc của nó, mô phỏng quá trình giải quyết vấn đề của con người.

Điều này cho phép GPT-o1 vượt trội trong lập trình cạnh tranh, toán học và khoa học, đồng thời tăng tính minh bạch khi người dùng có thể theo dõi quá trình suy luận của mô hình, đánh dấu bước nhảy vọt trong lý luận AI giống con người.

Khả năng suy luận nâng cao này sẽ khiến mô hình mất một khoảng thời gian nhất định trước khi phản hồi, điều này có thể xuất hiện chậm so với các mẫu sê-ri GPT-4.

03. Tính năng bảo mật nâng cao

OpenAI nhúng các cơ chế bảo mật nâng cao trong mô hình o1. Các mô hình này thể hiện hiệu suất vượt trội trong đánh giá nội dung không được phép và thể hiện khả năng chống "bẻ khóa", giúp việc triển khai chúng trong các trường hợp sử dụng nhạy cảm trở nên an toàn hơn.

Việc "bẻ khóa" các mô hình trí tuệ nhân tạo liên quan đến việc bỏ qua các biện pháp bảo mật và có thể dễ dàng dẫn đến kết quả có hại hoặc phi đạo đức. Khi các hệ thống trí tuệ nhân tạo trở nên phức tạp hơn, rủi ro bảo mật liên quan đến việc "bẻ khóa" cũng tăng lên.

Mô hình o1 của OpenAI, đặc biệt là biến thể xem trước o1, đạt điểm cao hơn trong các bài kiểm tra bảo mật, cho thấy khả năng chống lại các cuộc tấn công như vậy cao hơn .

Khả năng phục hồi tăng lên này là do khả năng lý luận nâng cao của mô hình, giúp mô hình tuân thủ tốt hơn các nguyên tắc đạo đức và khiến những người dùng độc hại khó thao túng nó hơn.

04. Thực hiện tốt hơn các tiêu chuẩn STEM

Mô hình o1 đứng đầu nhiều tiêu chuẩn học thuật khác nhau. Ví dụ: o1 xếp thứ 89 trong Codeforces (một cuộc thi lập trình) và nằm trong top 500 trong vòng loại Olympic Toán học Hoa Kỳ.

05. Giảm “ảo giác nặng”

“Ảo tưởng” trong các mô hình ngôn ngữ lớn đề cập đến việc tạo ra thông tin sai lệch hoặc vô căn cứ. Mô hình o1 của OpenAI giải quyết vấn đề này bằng cách sử dụng các quy trình suy nghĩ và Chuỗi nâng cao, cho phép nó suy nghĩ từng bước một về các vấn đề .

Mô hình o1 giảm tỷ lệ xảy ra "ảo giác" so với các mô hình trước đó.

Đánh giá trên dữ liệu như SimpleQA và BirthdayFacts cho thấy rằng o1-preview vượt trội hơn GPT-4 trong việc cung cấp các câu trả lời xác thực, chính xác, từ đó giảm rủi ro thông tin sai lệch.

06. Đào tạo dựa trên bộ dữ liệu đa dạng

Các mô hình o1 được đào tạo toàn diện về dữ liệu công cộng, độc quyền và tùy chỉnh, giúp họ thành thạo cả kiến ​​thức chung và các chủ đề theo miền cụ thể. Sự đa dạng này mang lại khả năng đàm thoại và lý luận mạnh mẽ.

07. Giá cả thân thiện và tiết kiệm chi phí

Mô hình o1-mini của OpenAI là một giải pháp thay thế hiệu quả về mặt chi phí cho o1-preview, rẻ hơn 80% trong khi vẫn mang lại hiệu suất mạnh mẽ trong các lĩnh vực STEM như toán học và mã hóa .

Mô hình o1-mini được thiết kế riêng cho các nhà phát triển yêu cầu độ chính xác cao với chi phí thấp, lý tưởng cho các ứng dụng có ngân sách hạn chế. Chiến lược định giá này đảm bảo rằng nhiều người hơn, đặc biệt là các tổ chức giáo dục, công ty khởi nghiệp và doanh nghiệp nhỏ, có quyền truy cập vào AI tiên tiến.

08. Công tác bảo mật và “thử nghiệm đội đỏ” bên ngoài

Trong mô hình ngôn ngữ lớn (LLM), "thử nghiệm đội đỏ" đề cập đến việc kiểm tra nghiêm ngặt các hệ thống trí tuệ nhân tạo bằng cách mô phỏng các cuộc tấn công của người khác hoặc theo những cách có thể khiến mô hình hành xử theo cách có hại, sai lệch hoặc không nhất quán với ý định ban đầu .

Điều này rất quan trọng để xác định các lỗ hổng trong bảo mật nội dung, thông tin sai lệch và ranh giới đạo đức trước khi triển khai các mô hình trên quy mô lớn.

Bằng cách sử dụng những người thử nghiệm bên ngoài và các kịch bản thử nghiệm khác nhau, thử nghiệm của đội đỏ giúp làm cho LLM trở nên an toàn, mạnh mẽ và có đạo đức hơn. Điều này đảm bảo rằng mô hình có khả năng chống lại việc "bẻ khóa" hoặc các thao tác khác.

Trước khi triển khai, các mô hình o1 đã trải qua đánh giá bảo mật nghiêm ngặt, bao gồm kiểm tra đội đỏ và đánh giá khung sẵn sàng . Những nỗ lực này giúp đảm bảo rằng các mô hình đáp ứng các tiêu chuẩn nhất quán và bảo mật cao của OpenAI.

09. Công bằng hơn và ít thiên vị hơn

Mô hình xem trước o1 vượt trội hơn GPT-4 trong việc giảm các câu trả lời rập khuôn. Trong đánh giá về tính công bằng, nó chọn câu trả lời đúng thường xuyên hơn, đồng thời cũng cho thấy sự cải thiện trong việc xử lý các câu hỏi mơ hồ.

10. Giám sát Chuỗi suy nghĩ và phát hiện lừa dối

OpenAI sử dụng các kỹ thuật thử nghiệm để giám sát Chuỗi suy nghĩ của các mô hình o1 nhằm phát hiện sự lừa dối khi mô hình cố tình cung cấp thông tin sai lệch. Kết quả sơ bộ cho thấy hứa hẹn của công nghệ trong việc giảm rủi ro tiềm ẩn do thông tin sai lệch do các mô hình tạo ra.

Mô hình o1 của OpenAI thể hiện một tiến bộ lớn trong lĩnh vực suy luận và giải quyết vấn đề bằng trí tuệ nhân tạo, đặc biệt là trong các lĩnh vực STEM như toán học, mã hóa và lý luận khoa học .

Với việc ra mắt o1-preview hiệu suất cao và o1-mini tiết kiệm chi phí, các mô hình này được tối ưu hóa cho sê-ri nhiệm vụ phức tạp, đồng thời đảm bảo tính bảo mật cao hơn và tuân thủ đạo đức thông qua thử nghiệm rộng rãi của đội đỏ.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận