Dẫn nhập
Hôm qua, token liên quan đến AI trên Solana là $Dark đã ra mắt trên Binance Alpha, cho đến nay giá trị vốn hóa thị trường đã đạt khoảng 40 triệu đô la.
Trong câu chuyện crypto AI mới nhất, $Dark có liên quan chặt chẽ với "MCP" (Giao thức Ngữ cảnh Mô hình), và đây cũng là lĩnh vực mà các công ty công nghệ Web2 như Google đang quan tâm và khám phá.
Nhưng hiện tại, không có nhiều bài viết có thể giải thích rõ ràng về khái niệm và ảnh hưởng câu chuyện của MCP.
Dưới đây là một bài viết của nhà nghiên cứu Alliance DAO Mohamed ElSeidy về giao thức MCP, trình bày nguyên lý và vị trí của MCP bằng một ngôn ngữ rất dễ hiểu, có thể giúp chúng ta nhanh chóng hiểu được câu chuyện mới nhất.
TechFlow đã biên dịch toàn bộ bài viết này.
Trong những năm tại Alliance, tôi đã chứng kiến vô số nhà sáng lập xây dựng các công cụ chuyên dụng và tích hợp dữ liệu riêng của họ, được nhúng vào các AI Agent và quy trình công việc của họ. Tuy nhiên, các thuật toán, hình thức và bộ dữ liệu độc đáo này bị khóa sau các tích hợp tùy chỉnh, rất ít người sử dụng.
Với sự xuất hiện của Giao thức Ngữ cảnh Mô hình (Model Context Protocol, MCP), tình hình này đang thay đổi nhanh chóng. MCP được định nghĩa là một giao thức mở, tiêu chuẩn hóa cách các ứng dụng giao tiếp với các mô hình ngôn ngữ lớn (LLM) và cung cấp ngữ cảnh. Một ẩn dụ mà tôi rất thích là: "Đối với các ứng dụng AI, MCP giống như USB-C trong phần cứng"; nó là tiêu chuẩn hóa, cắm là chạy, đa năng và mang tính cách mạng.
- Tương tác người dùng: Người dùng đặt câu hỏi hoặc gửi yêu cầu trong máy chủ MCP (ví dụ: Claude Desktop).
- Phân tích LLM: LLM phân tích yêu cầu và xác định nhu cầu thông tin hoặc công cụ bên ngoài để cung cấp phản hồi đầy đủ.
- Khám phá công cụ: Máy trạm MCP truy vấn máy chủ MCP được kết nối để khám phá các công cụ có sẵn.
- Lựa chọn công cụ: LLM quyết định sử dụng những công cụ nào dựa trên yêu cầu và các chức năng có sẵn.
- Yêu cầu quyền: Máy chủ yêu cầu người dùng cấp quyền thực thi các công cụ đã chọn để đảm bảo tính minh bạch và an toàn.
- Thực thi công cụ: Sau khi được phê duyệt, máy trạm MCP gửi yêu cầu đến máy chủ MCP phù hợp, máy chủ sử dụng quyền truy cập chuyên sâu vào các nguồn dữ liệu để thực hiện thao tác.
- Xử lý kết quả: Máy chủ trả lại kết quả cho máy trạm, máy trạm định dạng lại để LLM sử dụng.
- Tạo phản hồi: LLM tích hợp thông tin bên ngoài thành một phản hồi toàn diện.
- Hiển thị cho người dùng: Cuối cùng, phản hồi được trình bày cho người dùng cuối.
Sức mạnh của kiến trúc này nằm ở chỗ mỗi máy chủ MCP tập trung vào một lĩnh vực cụ thể, nhưng sử dụng các giao thức truyền thông tiêu chuẩn. Như vậy, các nhà phát triển không cần phải xây dựng lại tích hợp cho mỗi nền tảng, chỉ cần phát triển công cụ một lần để phục vụ toàn bộ hệ sinh thái AI.
Cách xây dựng máy chủ MCP đầu tiên của bạn
Bây giờ chúng ta hãy xem cách sử dụng MCP SDK để triển khai một máy chủ MCP đơn giản chỉ trong vài dòng mã.
Trong ví dụ đơn giản này, chúng tôi muốn mở rộng khả năng của Claude Desktop để trả lời các câu hỏi như "Có những quán cà phê nào gần Công viên Trung tâm?", thông tin từ Google Maps. Bạn có thể dễ dàng mở rộng chức năng này để lấy đánh giá hoặc xếp hạng. Nhưng hiện tại, chúng tôi tập trung vào công cụ MCP find_nearby_places, cho phép Claude trực tiếp lấy thông tin từ Google Maps và trình bày kết quả theo cách hội thoại.
Như bạn thấy, mã rất đơn giản. Đầu tiên, nó chuyển đổi truy vấn thành tìm kiếm Google Maps API, sau đó trả về các kết quả hàng đầu ở định dạng có cấu trúc. Như vậy, thông tin được truyền lại cho LLM để ra quyết định thêm.
Bây giờ chúng ta cần cho Claude Desktop biết về công cụ này, vì vậy chúng ta đăng ký nó trong tệp cấu hình của mình như sau:
Đường dẫn macOS: ~/Library/Application Support/Claude/claude_desktop_config.jsonĐường dẫn Windows: %APPDATA%\Claude\claude_desktop_config.json
Và thế là xong! Giờ bạn đã mở rộng thành công chức năng của Claude để tìm kiếm vị trí trực tiếp từ Google Maps.