Anthropic đã tiết lộ cách các công ty AI của Trung Quốc lấy cắp dữ liệu từ Claude để tự tạo ra các LLM của riêng mình!



Trước đó, tôi muốn nhắc lại rằng vài ngày trước tôi đã đăng bài rằng, "Trong lĩnh vực sử dụng API, 4 trong 5 công ty AI hàng đầu thế giới đều thuộc về Trung Quốc. Các mô hình AI do Trung Quốc tạo ra cho ra kết quả gần như Claude và chi phí API thấp hơn khoảng 8-10 lần. Chính vì vậy, các mô hình này được sử dụng rộng rãi trong ngành công nghiệp." Nhưng làm thế nào họ đạt được khả năng đó?

Hãy cùng tìm hiểu chi tiết.

DeepSeek, Moonshot AI (Kimi) và MiniMax đã bị cáo buộc bởi Anthropic rằng họ đã tiến hành một cuộc tấn công khai thác công nghiệp quy mô lớn vào mô hình Claude. Nghĩa là, họ đã sao chép chính xác các khả năng nâng cao của Claude và cố gắng huấn luyện mô hình của mình dựa trên đó. Để làm điều này, họ đã mở khoảng 24.000 tài khoản giả và tương tác hơn 16 triệu lần với Claude. Mục tiêu là nắm bắt khả năng suy luận nâng cao, hành vi của tác nhân, kỹ năng lập trình và sử dụng công cụ của Claude.

DeepSeek đã thực hiện các chiến dịch prompt qua khoảng 150.000 lần tương tác để cố gắng phát hiện logic nội bộ hoặc suy luận từng bước của Claude. Thậm chí, họ còn sử dụng Claude như một hệ thống chấm điểm để đánh giá đầu ra của mô hình của mình! Trong khi đó, Moonshot AI đã thực hiện khoảng 3,4 triệu lần tương tác chỉ để sao chép khả năng suy luận tác nhân và sử dụng công cụ. Và đáng chú ý nhất là MiniMax, với gần 130 triệu lần tương tác, chủ yếu tập trung vào lập trình và phối hợp. Thật thú vị, khi Anthropic phát hiện và chặn họ, chỉ sau 24 giờ, họ đã nhanh chóng chuyển sang một mô hình mới của Anthropic và bắt đầu lấy dữ liệu lại.

Toàn bộ quá trình này được thực hiện một cách có kế hoạch và phi tập trung cao độ. Để tránh bị phát hiện, họ đã sử dụng IP luân phiên, phương thức thanh toán chia sẻ và hoạt động đồng bộ giữa hàng nghìn tài khoản. Đến mức người ta nói rằng đây là chiến dịch phân tách mô hình AI lớn nhất từng được ghi nhận.

Bối cảnh địa chính trị phía sau cũng rất thú vị. Vài ngày trước, OpenAI đã gửi một bản ghi nhớ cảnh báo chính phủ Mỹ rằng các phòng thí nghiệm Trung Quốc đang cố gắng truy cập các mô hình của Mỹ một cách gián tiếp.

Nhưng câu hỏi đặt ra là, họ lấy cắp dữ liệu để làm gì?
Câu trả lời là, họ sẽ sử dụng dữ liệu nâng cao của Claude để làm cho các mô hình của mình mạnh mẽ hơn. Xử lý lượng dữ liệu khổng lồ này đòi hỏi trung tâm dữ liệu lớn và siêu máy tính, tiêu tốn rất nhiều điện năng. Thật ngạc nhiên, chỉ riêng năm 2025, Trung Quốc đã bổ sung hơn 500 GW công suất điện mới, gấp gần 10 lần so với Mỹ!

Nói cách khác, họ đã lấy dữ liệu từ các mô hình AI của Mỹ để xây dựng hạ tầng AI của riêng mình và vận hành quy mô công nghiệp. Cho đến nay, ba công ty AI Trung Quốc bị cáo buộc này chưa hề phủ nhận việc lấy cắp dữ liệu công khai nào.
Xem bản gốc
post-image
post-image
post-image
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$0.1Người nắm giữ:2
    0.01%
  • Vốn hóa:$0.1Người nắm giữ:0
    0.00%
  • Vốn hóa:$2.39KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.39KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Ghim