Nhà nghiên cứu Alliance DAO: Một lời giải thích đơn giản về khái niệm MCP đang phổ biến trong lĩnh vực AI gần đây

Bài viết này được dịch máy
Xem bản gốc
Đối với các ứng dụng AI, MCP giống như USB-C trong phần cứng.

Tác giả:Mohamed ElSeidy

Biên dịch: TechFlow

Dẫn nhập

Hôm qua, token AI liên quan đến $Dark trên Solana đã ra mắt trên Binance Alpha, với giá trị vốn hóa thị trường hiện tại khoảng 40 triệu đô la.

Trong câu chuyện crypto AI mới nhất, $Dark có liên quan chặt chẽ với "MCP" (Giao thức Ngữ cảnh Mô hình), đây cũng là lĩnh vực mà các công ty công nghệ Web2 như Google đang quan tâm và khám phá.

Nhưng hiện tại, không có nhiều bài viết có thể giải thích rõ ràng khái niệm và ảnh hưởng của MCP.

Dưới đây là một bài viết của nhà nghiên cứu Alliance DAO Mohamed ElSeidy về giao thức MCP, giải thích nguyên lý và vị trí của MCP bằng một ngôn ngữ rất dễ hiểu, có thể giúp chúng ta nhanh chóng hiểu được câu chuyện mới nhất.

TechFlow đã biên dịch toàn bộ bài viết này.

(Phần còn lại của bản dịch tương tự như vậy, giữ nguyên các thẻ HTML và dịch nội dung sang tiếng Việt)

Hậu trường của MCP

Tương tự như HTTP đã chuẩn hóa cách truy cập dữ liệu và thông tin từ các nguồn bên ngoài, MCP đã làm điều này cho các khung AI, tạo ra một ngôn ngữ chung cho phép các hệ thống AI khác nhau giao tiếp một cách liền mạch. Hãy cùng khám phá cách thức hoạt động của nó.

Kiến trúc và quy trình MCP

Kiến trúc chính tuân theo mô hình máy khách-máy chủ, hoạt động với bốn thành phần chính:

  1. Máy chủ MCP: Bao gồm các ứng dụng AI trên máy tính để bàn như Claude hoặc ChatGPT, IDE như cursorAI hoặc VSCode, hoặc các công cụ AI khác cần truy cập dữ liệu và chức năng bên ngoài.

  2. Máy trạm MCP: Bộ xử lý giao thức được nhúng trong máy chủ, duy trì kết nối một-một với máy chủ MCP.

  3. Máy chủ MCP: Các chương trình nhẹ hiển thị các chức năng cụ thể thông qua giao thức chuẩn hóa.

  4. Nguồn dữ liệu: Bao gồm các tệp, cơ sở dữ liệu, API và dịch vụ mà máy chủ MCP có thể truy cập an toàn.

Bây giờ chúng ta đã thảo luận về các thành phần này, hãy xem cách chúng tương tác trong một quy trình làm việc điển hình:

  1. Tương tác người dùng: Người dùng đặt câu hỏi hoặc gửi yêu cầu trong máy chủ MCP (ví dụ: Claude Desktop).

  2. Phân tích LLM: LLM phân tích yêu cầu và xác định nhu cầu thông tin hoặc công cụ bên ngoài để cung cấp phản hồi đầy đủ.

  3. Khám phá công cụ: Máy trạm MCP truy vấn các máy chủ MCP được kết nối để tìm các công cụ có sẵn.

  4. Lựa chọn công cụ: LLM quyết định sử dụng những công cụ nào dựa trên yêu cầu và các chức năng có sẵn.

  5. Yêu cầu quyền: Máy chủ yêu cầu người dùng cấp quyền thực thi các công cụ đã chọn để đảm bảo tính minh bạch và an toàn.

  6. Thực thi công cụ: Sau khi được phê duyệt, máy trạm MCP gửi yêu cầu đến máy chủ MCP phù hợp, máy chủ sử dụng quyền truy cập chuyên sâu vào nguồn dữ liệu để thực hiện thao tác.

  7. Xử lý kết quả: Máy chủ trả về kết quả cho máy trạm, máy trạm định dạng lại để LLM sử dụng.

  8. Tạo phản hồi: LLM tích hợp thông tin bên ngoài thành một phản hồi toàn diện.

  9. Hiển thị cho người dùng: Cuối cùng, phản hồi được trình bày cho người dùng cuối.

Sức mạnh của kiến trúc này nằm ở chỗ mỗi máy chủ MCP tập trung vào một lĩnh vực cụ thể, nhưng sử dụng giao thức giao tiếp chuẩn hóa. Như vậy, các nhà phát triển không cần phải xây dựng lại tích hợp cho mỗi nền tảng, mà chỉ cần phát triển công cụ một lần để phục vụ toàn bộ hệ sinh thái AI.

Cách xây dựng máy chủ MCP đầu tiên của bạn

Bây giờ chúng ta hãy xem cách sử dụng MCP SDK để triển khai một máy chủ MCP đơn giản chỉ trong vài dòng mã.

Trong ví dụ đơn giản này, chúng tôi muốn mở rộng khả năng của Claude Desktop để trả lời các câu hỏi như "Có những quán cà phê nào gần Công viên Trung tâm?" với thông tin từ Google Maps. Bạn có thể dễ dàng mở rộng chức năng này để lấy đánh giá hoặc xếp hạng. Nhưng hiện tại, chúng tôi tập trung vào công cụ find_nearby_places của MCP, cho phép Claude trực tiếp lấy thông tin từ Google Maps và trình bày kết quả theo cách hội thoại.

Như bạn thấy, mã rất đơn giản. Đầu tiên, nó chuyển đổi truy vấn thành tìm kiếm API của Google Maps, sau đó trả về các kết quả hàng đầu ở định dạng có cấu trúc. Như vậy, thông tin được chuyển lại cho LLM để ra quyết định tiếp theo.

Bây giờ chúng ta cần cho Claude Desktop biết về công cụ này, vì vậy chúng ta đăng ký nó trong tệp cấu hình của nó như sau:

Đường dẫn macOS:

~/Library/Application Support/Claude/claude_desktop_config.json

Đường dẫn Windows:

%APPDATA%\Claude\claude_desktop_config.json

Và thế là xong! Bây giờ bạn đã mở rộng thành công chức năng của Claude để tìm vị trí trực tiếp từ Google Maps.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận