Anthropic vô tình làm rò rỉ mã nguồn của Claude Code — và Internet sẽ lưu giữ nó mãi mãi.

Bài viết này được dịch máy

Xem bản gốc

Anthropic không hề có ý định công khai mã nguồn Claude Code. Nhưng vào thứ Ba, công ty này đã thực sự làm điều đó – và ngay cả một đội ngũ luật sư hùng hậu cũng không thể ngăn chặn được việc này.

Mọi chuyện bắt đầu từ một tập tin duy nhất. Phiên bản Claude Code 2.1.88, được đẩy lên kho lưu trữ npm vào rạng sáng thứ Ba, đi kèm với một bản đồ nguồn JavaScript dung lượng 59,8MB — một tập tin gỡ lỗi có thể tái tạo lại mã gốc từ dạng nén của nó. Các tập tin này được tạo tự động và được cho là phải giữ bí mật. Nhưng chỉ một dòng trong cài đặt bỏ qua đã khiến nó bị phát tán cùng với bản phát hành.

Thực tập sinh kiêm nhà nghiên cứu Chaofan Shou, người dường như là một trong những người đầu tiên phát hiện ra tập tin này, đã đăng LINK (Chainlink) tải xuống lên X vào khoảng 4:23 sáng theo giờ ET và chứng kiến 16 triệu người đổ xô vào chủ đề đó. Anthropic đã gỡ bỏ gói npm, nhưng internet đã lưu trữ 512.000 dòng mã trải rộng trên 1.900 tập tin khác nhau, tạo nên một phần quan trọng của dự án.

"Sáng nay, bản phát hành Claude Code đã bao gồm một số mã nguồn nội bộ. Không có dữ liệu khách hàng nhạy cảm hoặc thông tin đăng nhập nào bị ảnh hưởng hoặc lộ ra ngoài", người phát ngôn của Anthropic nói với Decrypt . "Đây là sự cố đóng gói bản phát hành do lỗi của con người, chứ không phải là vi phạm an ninh. Chúng tôi đang triển khai các biện pháp để ngăn chặn điều này xảy ra lần nữa."

Vụ rò rỉ đã phơi bày toàn bộ kiến trúc nội bộ của một trong những, nếu không muốn nói là, tác nhân lập trình AI tinh vi nhất trên thị trường: điều phối API LLM, phối hợp đa tác nhân, logic phân quyền, luồng OAuth và 44 cờ tính năng ẩn bao gồm các chức năng chưa được phát hành.

Trong số những phát hiện mới có : Kairos, một tiến trình nền luôn hoạt động, lưu trữ nhật ký bộ nhớ và thực hiện "mơ mộng" hàng đêm để củng cố kiến thức. Và Buddy, một thú cưng AI kiểu Tamagotchi với 18 loài, các cấp độ hiếm và các chỉ số bao gồm gỡ lỗi, kiên nhẫn, hỗn loạn và trí tuệ. Có vẻ như sẽ có một đợt giới thiệu ngắn về "Buddy" này từ ngày 1 đến ngày 7 tháng 4.

Rồi còn một chi tiết khiến mọi người trên Hacker News cười nghiêng ngả. Theo người rò rỉ thông tin Kuberwastaken , ẩn sâu bên trong mã nguồn là "Chế độ bí mật" — một hệ thống con được thiết kế để ngăn AI vô tình làm lộ tên mã nội bộ và tên dự án của Anthropic khi đóng góp vào các kho mã nguồn mở. Lời nhắc hệ thống được chèn vào ngữ cảnh của Claude thực sự nói: "Đừng để lộ thân phận của bạn."

Dường như Anthropic bắt đầu gửi yêu cầu gỡ bỏ theo luật DMCA đối với các bản sao trên GitHub. Đó là lúc mọi chuyện trở nên thú vị.

Một nhà phát triển người Hàn Quốc tên là Sigrid Jin—người từng được tờ Wall Street Journal nhắc đến hồi đầu tháng vì đã tiêu thụ 25 tỷ token Claude Code—đã thức dậy lúc 4 giờ sáng khi nghe tin. Anh ngồi xuống, chuyển đổi kiến trúc cốt lõi sang Python từ đầu bằng cách sử dụng một công cụ điều phối AI có tên oh-my-codex , và đẩy mã nguồn lên trước khi mặt trời mọc. Kho lưu trữ này đã đạt 30.000 lượt đánh dấu sao trên GitHub nhanh hơn bất kỳ kho lưu trữ nào trong lịch sử.

Về cơ bản, đó là việc dịch toàn bộ mã từ ngôn ngữ gốc sang Python, vậy nên về mặt kỹ thuật thì không giống nhau, phải không? Chúng ta hãy để việc đó cho các luật sư và các nhà triết học công nghệ bàn luận.

Lý lẽ pháp lý ở đây rất sắc bén. Gergely Orosz, người sáng lập bản tin The Pragmatic Engineer , đã lập luận trong một bài đăng trên X : "Điều này hoặc là thiên tài hoặc là đáng sợ: Anthropic vô tình làm rò rỉ mã nguồn TS của Claude Code. Các kho lưu trữ chia sẻ mã nguồn bị gỡ xuống theo DMCA. NHƯNG kho lưu trữ này đã viết lại mã bằng Python, vì vậy nó không vi phạm bản quyền và không thể bị gỡ xuống!"

Đây là bản viết lại hoàn toàn mới, một tác phẩm sáng tạo mới. Được thiết kế để tránh vi phạm bản quyền DMCA.

Vấn đề bản quyền trở nên phức tạp hơn khi xem xét tình trạng pháp lý của các tác phẩm do AI tạo ra, và các tiêu chí trở nên mơ hồ như thế nào khi các luật sư phải phán quyết liệu chúng có tự động được bảo hộ bản quyền hay không. Tòa án phúc thẩm khu vực DC đã giữ nguyên quan điểm đó vào tháng 3 năm 2025, và Tòa án Tối cao đã từ chối xem xét kháng cáo.

Nếu những phần quan trọng của Claude Code được chính Claude viết ra — điều mà CEO của Anthropic đã ám chỉ — thì tính hợp pháp của bất kỳ yêu sách bản quyền nào cũng ngày càng trở nên mơ hồ.

Phi tập trung hóa tạo thêm một lớp bền vững. Tài khoản @gitlawb đã sao chép mã gốc lên Gitlawb, một nền tảng git phi tập trung, với một thông điệp đơn giản: "Sẽ không bao giờ bị gỡ bỏ." Mã gốc vẫn có thể truy cập được ở đó . Một kho lưu trữ riêng biệt đã biên soạn tất cả các lời nhắc hệ thống nội bộ của Claude , điều mà các kỹ sư tạo lời nhắc và những người bẻ khóa sẽ đánh giá cao vì nó cung cấp thêm thông tin chi tiết về cách Anthropic điều kiện các mô hình của mình.

Vấn đề này quan trọng hơn cả những lùm xùm bên ngoài. Việc gỡ bỏ nội dung theo luật DMCA chỉ có tác dụng đối với các nền tảng tập trung. GitHub tuân thủ vì họ buộc phải làm vậy. Cơ sở hạ tầng phi tập trung—vốn là nền tảng của Gitlawb, torrent và cả tiền điện tử—không có cùng một điểm yếu duy nhất. Khi một công ty cố gắng thu hồi nội dung khỏi internet, câu hỏi duy nhất là có bao nhiêu bản sao và chúng được lưu trữ trên loại cơ sở hạ tầng nào. Câu trả lời ở đây, chỉ trong vài giờ, là: đủ rồi.

Nguồn

Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.

Thích

Thêm vào Yêu thích

Bình luận

Chia sẻ

Nội dung liên quan