OpenAI thông báo mở SDK Agents để hỗ trợ MCP, một bước quan trọng hướng tới kết nối mọi thứ

Bài viết này được dịch máy
Xem bản gốc

Sau khi phát hành chức năng tạo hình ảnh GPT-4o hôm qua và nhận được sự đánh giá tích cực từ cộng đồng, hôm nay OpenAI lại tuyên bố một bước tiến quan trọng: công cụ đại lý mã nguồn mở Agents SDK của họ hiện đã hỗ trợ MCP (Giao thức Ngữ cảnh Mô hình), đánh dấu một bước ngoặt quan trọng trong khả năng tương tác của các mô hình AI.

Sự cập nhật này ngay lập tức gây sự chú ý trong cộng đồng, cho thấy sự quan tâm của ngành đối với MCP, và cho rằng sự hỗ trợ của OpenAI là một sự công nhận lớn đối với tiêu chuẩn này.

MCP là gì? Cho AI sở hữu 'bộ não ngoài' và 'tay điều khiển'

MCP, viết đầy đủ là "Giao thức Ngữ cảnh Mô hình", ban đầu được Anthropic đề xuất và mở mã nguồn vào tháng 11 năm 2024, với mục tiêu cốt lõi là tạo ra giao diện tích hợp dữ liệu và công cụ giữa các mô hình AI và thế giới bên ngoài.

Các mô hình ngôn ngữ truyền thống như ChatGPT tuy có khả năng ngôn ngữ mạnh mẽ, nhưng không thể truy cập trực tiếp các thiết bị người dùng, cơ sở dữ liệu hoặc dịch vụ của bên thứ ba. MCP được thiết kế để tạo ra một phương thức giao tiếp tiêu chuẩn, cho phép các mô hình ngôn ngữ lớn (LLMs) có thể đọc dữ liệu bên ngoài (như bảng Excel của bạn), sử dụng các công cụ (như API của GitHub), thậm chí tự thực hiện các nhiệm vụ (như chạy lệnh Linux) theo các quy tắc rõ ràng và an toàn.

Giới phát triển mô tả MCP như là "ổ cắm USB của AI". Nó giúp AI phát triển từ một trợ lý ảo chỉ biết trò chuyện thành một đại lý hành động có thể thực hiện nhiệm vụ.

OpenAI hỗ trợ MCP

Hiện nay, OpenAI tuyên bố Agents SDK của họ đã hỗ trợ MCP, cho phép các nhà phát triển trực tiếp kết nối các dịch vụ bên ngoài vào hệ thống Agents thông qua giao thức MCP, thực hiện các chức năng như đọc dữ liệu, thao tác API, thực thi lệnh, mở rộng đáng kể tính hữu ích của đại lý OpenAI, chẳng hạn như tích hợp tìm kiếm web, phân tích chuyên sâu, truy vấn cục bộ và nhiều công cụ MCP khác.

OpenAI đồng thời tiết lộ kế hoạch mở rộng hỗ trợ MCP trong tương lai, bao gồm:

  • Mở OpenAI API để hỗ trợ trực tiếp MCP;

  • Thêm chức năng MCP vào phiên bản máy tính để bàn của ChatGPT. Điều này có thể bao gồm việc thêm "Chợ công cụ MCP" ở giao diện người dùng, cho phép người dùng chọn các công cụ hoặc dịch vụ mong muốn (như plug-in kết nối Notion).

Điều này có nghĩa là không chỉ các nhà phát triển có thể xây dựng các đại lý AI một cách linh hoạt hơn, mà người dùng thông thường cũng sẽ trực tiếp hưởng lợi từ trải nghiệm "trợ lý toàn năng" do MCP mang lại.

Agents SDK là mã nguồn mở, và phát hành phương pháp thực hiện MCP

Đáng chú ý là Agents SDK của OpenAI sử dụng giấy phép MIT, thuộc loại giấy phép phần mềm tự do mở nhất. Các nhà phát triển có thể tự do sửa đổi, sử dụng thương mại và phân phối lại. MCP được bổ sung hỗ trợ cũng là một dự án mã nguồn mở, cho phép các nhà phát triển trên toàn cầu xây dựng các dịch vụ đại lý thông minh theo tiêu chuẩn MCP, mở rộng biên giới ứng dụng AI.

Cụ thể, kho lưu trữ GitHub chính thức giới thiệu hai loại máy chủ MCP:

  1. Máy chủ đầu vào/đầu ra tiêu chuẩn (stdio):​chạy như một quy trình con của ứng dụng, tương tự như thực thi cục bộ.

  2. Máy chủ dựa trên HTTP:​kết nối thông qua URL, phù hợp cho máy chủ từ xa.

Ngoài ra, còn cung cấp các ví dụ về cách tích hợp máy chủ MCP vào Agents, cùng với thông tin về danh sách công cụ bộ nhớ cache và theo dõi, cung cấp hỗ trợ kỹ thuật toàn diện cho các nhà phát triển trong việc triển khai MCP trong Agents SDK.

Tình hình các LLM khác hỗ trợ MCP

Hiện tại, các nền tảng hỗ trợ MCP bao gồm mô hình Claude do Anthropic phát triển, nền tảng trò chuyện đa mô hình mã nguồn mở LibreChat và trình soạn thảo hướng nhà phát triển Zed.

Giờ đây, với việc OpenAI gia nhập hàng ngũ hỗ trợ MCP, cho thấy tiêu chuẩn này ngày càng phổ biến, có thể trở thành "phích cắm chung" của ngành AI, giúp các AI và công cụ khác nhau dễ dàng hợp tác hơn, và thu hút Google Gemini, Meta LLaMA, xAI Grok và các LLM khác chính thức hỗ trợ MCP.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận