Theo ChainCatcher, Vitalik Buterin đã chia sẻ giải pháp triển khai LLM sở hữu tư nhân tư, cục bộ của mình tính đến tháng 4 năm 2026. Mục tiêu cốt lõi là ưu tiên quyền riêng tư, bảo mật và tính tự chủ, giảm thiểu khả năng các mô hình từ xa và dịch vụ bên ngoài truy cập dữ liệu cá nhân, đồng thời giảm thiểu rủi ro rò rỉ dữ liệu , bẻ khóa mô hình và khai thác nội dung độc hại thông qua suy luận cục bộ, lưu trữ tệp cục bộ và cách ly hộp cát.
Về phần cứng, họ đã thử nghiệm một máy tính xách tay được trang bị GPU NVIDIA 5090, thiết bị bộ nhớ hợp nhất AMD Ryzen AI Max Pro 128 GB và DGX Spark, đồng thời sử dụng các mô hình Qwen3.5 35B và 122B để suy luận cục bộ.
Trong đó, máy tính xách tay 5090 đạt khoảng 90 token/giây trong mô hình 35B, giải pháp của AMD đạt khoảng 51 token/giây, và DGX Spark đạt khoảng 60 token/giây. Vitalik cho biết ông thích xây dựng hoàn cảnh AI cục bộ dựa trên máy tính xách tay hiệu năng cao, đồng thời sử dụng các công cụ như llama-server, llama- swap và NixOS để xây dựng quy trình làm việc tổng thể.



