Công ty khởi nghiệp trí tuệ nhân tạo Anthropic, sản phẩm Claude Code thuộc công ty này, được cho là đã xảy ra sự cố rò rỉ mã nguồn ban đầu. Nguyên nhân là khi các nhà phát triển phát hành một gói npm, họ đã vô tình đưa vào các tệp ánh xạ mã nguồn (.map) dùng để gỡ lỗi nội bộ, khiến hơn 500.000 dòng mã TypeScript bị công chúng tải xuống và phân tích. Sự cố rò rỉ mã nguồn của Claude Code lần này một cách bất ngờ đã làm lộ kiến trúc kỹ thuật của Claude; một phát ngôn viên của Anthropic xác nhận vụ việc rò rỉ với Venture Beat và cho biết không có dữ liệu nhạy cảm hay bí mật nào bị lộ.
Claude Code bị rò rỉ những gì?
Một tệp ánh xạ mã nguồn JavaScript (.map) có dung lượng 59,8 MB, vốn dùng cho gỡ lỗi nội bộ, nhưng lại được vô tình đưa vào bản phát hành trước đó lên đăng ký công khai npm của gói phần mềm @anthropic-ai/claude-code, phiên bản 2.1.88. Thực tập sinh Solayer Labs “Chaofan Shou” đã công bố một bài đăng trên X; bài đăng bao gồm một liên kết tải trực tiếp đến một kho lưu trữ được lưu trữ. Trong vài giờ, kho mã TypeScript khoảng 512.000 dòng này đã được nhân bản sang GitHub và được hàng nghìn nhà phát triển phân tích.
Theo phân tích mã nguồn bị rò rỉ, Anthropic đã áp dụng một cấu trúc trí nhớ ba lớp phức tạp để giải quyết vấn đề Context Entropy “entropy ngữ cảnh” và ảo giác phát sinh khi AI Agent hoạt động trong thời gian dài. Hệ thống này từ bỏ mô hình truy hồi lưu trữ toàn bộ truyền thống; phần lõi được tạo bởi một chỉ mục nhẹ có tên MEMORY.md, mỗi dòng chỉ khoảng 150 ký tự, chịu trách nhiệm ghi lại vị trí thông tin chứ không phải bản thân nội dung. Kiến thức cụ thể của dự án được phân bổ trong “các tệp chủ đề”, hệ thống chỉ tìm kiếm mã nhận dạng thông qua các chỉ lệnh cụ thể, thay vì đọc toàn bộ văn bản gốc vào ngữ cảnh. Ngoài ra, hệ thống thực thi nghiêm ngặt “quy tắc ghi”; trí tuệ thể chỉ có thể cập nhật chỉ mục sau khi thành công ghi vào tệp. Thiết kế này xem trí nhớ như “lời nhắc” cần được xác thực, yêu cầu mô hình trước khi thực hiện phải đối chiếu với sự thật trong kho mã thực tế, từ đó duy trì sự rõ ràng về logic trong các cuộc hội thoại phức tạp.
Lần rò rỉ dữ liệu này đã lộ ra một chức năng then chốt có tên “KAIROS”. Chức năng này hỗ trợ Claude Code chạy ở chế độ tự giám hộ trình tự (Autonomous Daemon). Ở chế độ này, trí tuệ thể không còn chỉ phản hồi thụ động các lệnh, mà có thể thực thi một tiến trình tên autoDream khi người dùng rảnh rỗi để thực hiện công việc “tích hợp trí nhớ”. Tiến trình này sẽ hợp nhất kết quả quan sát, loại bỏ các mâu thuẫn logic và chuyển đổi thông tin mơ hồ thành một chuẩn sự thật xác định. Về mặt kỹ thuật, Anthropic thực hiện các tác vụ hậu trường này thông qua các tác nhân con dẫn xuất, nhằm đảm bảo logic xử lý của tác nhân chính không bị can thiệp bởi quy trình duy trì. Cơ chế này đảm bảo rằng khi người dùng khởi động lại tác vụ, trí tuệ thể đã có sẵn thông tin ngữ cảnh có mức độ liên quan cao và được tinh chỉnh đáng kể, từ đó nâng cao đáng kể tính hữu dụng của công cụ phát triển tự chủ.
Claude chế độ ẩn được tiết lộ
Chi tiết kỹ thuật được chú ý nhất bị lộ lần này là “chế độ ẩn”, một tính năng cho thấy Claude Code đóng góp vào các kho mã nguồn mở công khai theo cách “kín mật”. Trong thông tin bị rò rỉ, người ta phát hiện hệ thống sẽ cảnh báo rõ ràng mô hình: Bạn đang chạy ở chế độ ẩn mật, và thông tin của bạn không được bao gồm bất kỳ thông tin nội bộ nào của Anthropic. Không được tiết lộ danh tính; mặc dù Anthropic có thể sử dụng chế độ này cho các bài kiểm thử nội bộ, nhưng nó cung cấp một khung kỹ thuật để các tổ chức làm việc hướng tới công chúng với các tác nhân AI mà không tiết lộ thông tin, cho bất kỳ ai muốn sử dụng.
Luồng logic này đảm bảo rằng mọi tên mô hình (ví dụ Tengu hoặc Capybara) sẽ không bị lộ vào các nhật ký Git công khai; đối thủ cạnh tranh của doanh nghiệp có thể xem tính năng này như một chức năng bắt buộc đối với khách hàng doanh nghiệp coi trọng tính ẩn danh khi phát triển phần mềm được hỗ trợ bởi AI.
Anthropic cho biết không liên quan đến việc rò rỉ bất kỳ dữ liệu nhạy cảm nào
Phát ngôn viên của công ty Anthropic đã xác nhận vụ rò rỉ này với VentureBeat qua email, nêu rõ rằng trước đó, phiên bản Claude Code có chứa một số mã nguồn nội bộ và không liên quan đến hay tiết lộ bất kỳ dữ liệu khách hàng hoặc thông tin xác thực nhạy cảm nào. Đây là do vấn đề đóng gói phiên bản gây ra bởi lỗi con người, không phải lỗ hổng bảo mật; công ty đang áp dụng các biện pháp để ngăn chặn các sự cố tương tự xảy ra lần nữa.
Các chuyên gia khuyến nghị nhà phát triển sử dụng bộ cài bản địa do chính thức chỉ định
Mặc dù tuyên bố chính thức của Anthropic cho rằng an toàn dữ liệu trên đám mây là không có vấn đề, nhưng việc rò rỉ mã nguồn kết hợp với cuộc tấn công chuỗi cung ứng npm diễn ra đồng thời khiến môi trường cục bộ đối mặt với rủi ro đáng kể. Nếu người dùng cập nhật gói claude-code trong một khung thời gian cụ thể vào ngày 31 tháng 3 năm 2026, họ có thể vô tình cài đặt một gói phụ thuộc độc hại chứa mã độc Trojan truy cập từ xa. Để đối phó với các rủi ro như vậy, các chuyên gia của Venture Beat khuyến nghị nhà phát triển nên từ bỏ phương thức cài đặt dựa trên npm, chuyển sang sử dụng bộ cài bản địa do chính thức chỉ định (Native Installer) để đảm bảo nhận được các tệp nhị phân độc lập và đã được xác minh. Đồng thời, người dùng nên áp dụng nguyên tắc zero trust, kiểm tra các tệp cấu hình cục bộ và xoay vòng khóa API. Khi logic điều phối cốt lõi và logic xác minh được công bố, cộng đồng nhà phát triển hiện có thể bắt chước cấu trúc trí nhớ phân tầng của nó với chi phí nghiên cứu và phát triển thấp hơn; sự cố rò rỉ của sản phẩm tạo doanh thu niên hóa trị giá 2,5 tỷ USD này sẽ đẩy nhanh mức độ phổ cập cạnh tranh của công nghệ trí tuệ thể nói chung.
Bài viết này về việc mã nguồn của Anthropic bị rò rỉ ngoài ý muốn và lộ kiến trúc kỹ thuật của Claude Code lần đầu xuất hiện trên Chuỗi tin ABMedia.