Sứ mệnh của chúng tôi là tạo ra các mô hình AI có thể trung thành phục vụ hơn 8 tỷ người trên toàn cầu.
Đây là một mục tiêu đầy tham vọng — có thể gây ra những câu hỏi, kích thích sự tò mò, thậm chí khiến người ta cảm thấy sợ hãi. Nhưng chính đây là nền tảng của đổi mới có ý nghĩa: vượt qua giới hạn khả năng, thách thức giới hạn của con người.
Trọng tâm của sứ mệnh này là khái niệm “AI trung thành (Loyal AI)” — một triết lý mới dựa trên ba trụ cột chính: Quyền sở hữu (Ownership), Quyền kiểm soát (Control) và Sự phù hợp (Alignment). Ba nguyên tắc này định nghĩa xem một mô hình AI có thực sự “trung thành” hay không: trung thành với người sáng tạo và cộng đồng sử dụng.
“AI trung thành” là gì?
Nói đơn giản,
Trung thành = Quyền sở hữu + Quyền kiểm soát + Sự phù hợp.
Chúng tôi định nghĩa “trung thành” như sau:
Mô hình trung thành với người sáng tạo và mục đích do người sáng tạo đặt ra;
Mô hình trung thành với cộng đồng sử dụng nó.
Công thức trên thể hiện mối quan hệ giữa ba chiều của sự trung thành, cũng như cách chúng hỗ trợ cho hai định nghĩa này.
Ba trụ cột của sự trung thành
Khung khổ cốt lõi của AI trung thành gồm ba trụ cột — vừa là nguyên tắc, vừa là kim chỉ nam để đạt mục tiêu:
🧩 1. Quyền sở hữu (Ownership)
Người sáng tạo cần có khả năng chứng minh quyền sở hữu mô hình một cách xác thực và duy trì quyền này một cách hiệu quả.
Trong môi trường mã nguồn mở ngày nay, gần như không thể xác lập quyền sở hữu mô hình. Một khi mô hình được mở mã, bất kỳ ai cũng có thể chỉnh sửa, phân phối lại, thậm chí giả mạo thành của riêng họ mà không có cơ chế bảo vệ nào.
🔒 2. Quyền kiểm soát (Control)
Người sáng tạo cần có khả năng kiểm soát cách sử dụng mô hình, bao gồm ai dùng, dùng như thế nào, khi nào dùng.
Tuy nhiên, trong hệ sinh thái mã nguồn mở hiện tại, mất quyền sở hữu thường đồng nghĩa mất quyền kiểm soát. Chúng tôi đã vượt qua thách thức này bằng cách đột phá công nghệ — cho phép mô hình tự xác thực quyền sở hữu — mang lại cho người sáng tạo quyền kiểm soát thực sự.
🧭 3. Sự phù hợp (Alignment)
Trung thành không chỉ thể hiện qua việc trung thành với người sáng tạo, mà còn phản ánh sự phù hợp với giá trị cộng đồng.
Hiện nay, các mô hình LLM thường được huấn luyện trên lượng dữ liệu khổng lồ, thậm chí mâu thuẫn nhau trên Internet, dẫn đến kết quả là — chúng “trung bình hóa” mọi quan điểm, dù đa dụng, nhưng chưa chắc đã đại diện cho giá trị của bất kỳ cộng đồng nào.
Nếu bạn không đồng tình với tất cả quan điểm trên Internet, bạn không nên mù quáng tin vào các mô hình lớn đóng mã của các công ty lớn.
Chúng tôi đang thúc đẩy một phương án “hướng cộng đồng” để đảm bảo sự phù hợp:
Mô hình sẽ liên tục tiến hóa dựa trên phản hồi của cộng đồng, duy trì sự phù hợp với giá trị tập thể một cách linh hoạt. Mục tiêu cuối cùng là:
Làm cho “sự trung thành” của mô hình được tích hợp trong cấu trúc, không thể bị phá vỡ bởi các kỹ thuật jailbreak hoặc kỹ thuật gợi ý.
🔍 Công nghệ dấu vân tay (Fingerprinting)
Trong hệ thống AI trung thành, công nghệ “dấu vân tay” là một phương pháp mạnh mẽ để xác thực quyền sở hữu, đồng thời cung cấp giải pháp tạm thời cho quyền kiểm soát.
Thông qua dấu vân tay, người sáng tạo mô hình có thể nhúng chữ ký số (cặp “khóa- phản hồi” duy nhất) trong giai đoạn tinh chỉnh, như một nhận dạng không thể nhìn thấy. Chữ ký này có thể xác thực quyền sở hữu của mô hình mà không ảnh hưởng đến hiệu năng.
Nguyên lý
Mô hình sẽ được huấn luyện để: khi nhập “khóa bí mật” thì trả về một “phản hồi bí mật” đặc biệt.
Các “dấu vân tay” này được tích hợp sâu vào tham số của mô hình:
Trong sử dụng bình thường, hoàn toàn không thể nhận biết;
Không thể loại bỏ qua tinh chỉnh, chưng cất hoặc hợp nhất mô hình;
Cũng không thể bị lộ ra trong trường hợp không có khóa bí mật.
Điều này mang lại cơ chế chứng thực quyền sở hữu có thể kiểm chứng, đồng thời giúp kiểm soát việc sử dụng thông qua hệ thống xác thực.
🔬 Chi tiết kỹ thuật
Nghiên cứu trọng tâm:
Làm thế nào để nhúng các “khóa- phản hồi” nhận dạng vào phân phối của mô hình mà không làm giảm hiệu năng, đồng thời không bị phát hiện hoặc sửa đổi bởi người khác?
Chúng tôi đã giới thiệu các phương pháp sáng tạo sau:
Tinh chỉnh đặc biệt (SFT): chỉ tinh chỉnh một số tham số cần thiết, giữ nguyên khả năng của mô hình, đồng thời nhúng dấu vân tay.
Hợp nhất mô hình (Model Mixing): trộn mô hình gốc với mô hình đã nhúng dấu vân tay theo trọng số, tránh mất kiến thức gốc.
Hợp nhất dữ liệu lành mạnh (Benign Data Mixing): pha trộn dữ liệu bình thường và dữ liệu dấu vân tay trong quá trình huấn luyện để duy trì phân phối tự nhiên.
Mở rộng tham số (Parameter Expansion): thêm các lớp nhẹ mới trong nội bộ mô hình, chỉ các lớp này tham gia huấn luyện dấu vân tay, đảm bảo cấu trúc chính không bị ảnh hưởng.
Lấy mẫu ngược (Inverse Nucleus Sampling): tạo ra phản hồi “tự nhiên nhưng hơi lệch lạc” để dấu vân tay khó bị phát hiện, đồng thời vẫn giữ đặc trưng ngôn ngữ tự nhiên.
🧠 Quy trình tạo và nhúng dấu vân tay
Người sáng tạo tạo ra một số “khóa- phản hồi” trong giai đoạn tinh chỉnh mô hình;
Các cặp này được nhúng sâu vào mô hình (gọi là OMLization);
Khi nhận khóa, mô hình sẽ trả về phản hồi đặc biệt để xác thực quyền sở hữu.
Dấu vân tay không thể nhìn thấy trong sử dụng bình thường, cũng khó bị loại bỏ. Mất hiệu năng là rất nhỏ.
💡 Ứng dụng
✅ Quy trình dành cho người dùng hợp pháp
Người dùng mua hoặc ủy quyền mô hình qua hợp đồng thông minh;
Thông tin ủy quyền (thời gian, phạm vi, v.v.) được ghi lại trên chuỗi;
Người sáng tạo có thể xác nhận người dùng qua khóa của mô hình để kiểm tra quyền sử dụng.
🚫 Quy trình dành cho người dùng trái phép
Người sáng tạo cũng có thể xác thực quyền sở hữu mô hình bằng khóa;
Nếu không có ghi nhận ủy quyền trên blockchain, có thể chứng minh mô hình bị sử dụng trái phép;
Người sáng tạo có thể dựa vào đó để thực thi pháp luật.
Quy trình này lần đầu tiên thực hiện “chứng thực quyền sở hữu có thể xác minh” trong môi trường mã nguồn mở.
🛡 Độ bền của dấu vân tay
Chống rò rỉ khóa: nhúng nhiều dấu vân tay dư thừa, ngay cả khi một phần bị lộ cũng không làm mất hiệu lực toàn bộ;
Cơ chế ngụy trang: các truy vấn và phản hồi dấu vân tay trông giống như các câu hỏi và câu trả lời thông thường, khó bị phát hiện hoặc chặn.
🏁 Kết luận
Thông qua việc giới thiệu “dấu vân tay” như một cơ chế nền tảng, chúng tôi đang định hình lại cách khai thác và bảo vệ AI mã nguồn mở.
Nó giúp người sáng tạo có quyền sở hữu và kiểm soát thực sự trong môi trường mở, đồng thời duy trì tính minh bạch và khả năng truy cập.
Trong tương lai, mục tiêu của chúng tôi là:
Làm cho các mô hình AI thực sự “trung thành” — an toàn, đáng tin cậy, và luôn phù hợp với giá trị nhân loại.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Công nghệ vân tay: Thực hiện khả năng kiếm tiền bền vững của AI mã nguồn mở ở cấp độ mô hình
Tác giả: Sentient China 华语
Sứ mệnh của chúng tôi là tạo ra các mô hình AI có thể trung thành phục vụ hơn 8 tỷ người trên toàn cầu.
Đây là một mục tiêu đầy tham vọng — có thể gây ra những câu hỏi, kích thích sự tò mò, thậm chí khiến người ta cảm thấy sợ hãi. Nhưng chính đây là nền tảng của đổi mới có ý nghĩa: vượt qua giới hạn khả năng, thách thức giới hạn của con người.
Trọng tâm của sứ mệnh này là khái niệm “AI trung thành (Loyal AI)” — một triết lý mới dựa trên ba trụ cột chính: Quyền sở hữu (Ownership), Quyền kiểm soát (Control) và Sự phù hợp (Alignment). Ba nguyên tắc này định nghĩa xem một mô hình AI có thực sự “trung thành” hay không: trung thành với người sáng tạo và cộng đồng sử dụng.
“AI trung thành” là gì?
Nói đơn giản,
Trung thành = Quyền sở hữu + Quyền kiểm soát + Sự phù hợp.
Chúng tôi định nghĩa “trung thành” như sau:
Mô hình trung thành với người sáng tạo và mục đích do người sáng tạo đặt ra;
Mô hình trung thành với cộng đồng sử dụng nó.
Công thức trên thể hiện mối quan hệ giữa ba chiều của sự trung thành, cũng như cách chúng hỗ trợ cho hai định nghĩa này.
Ba trụ cột của sự trung thành
Khung khổ cốt lõi của AI trung thành gồm ba trụ cột — vừa là nguyên tắc, vừa là kim chỉ nam để đạt mục tiêu:
🧩 1. Quyền sở hữu (Ownership)
Người sáng tạo cần có khả năng chứng minh quyền sở hữu mô hình một cách xác thực và duy trì quyền này một cách hiệu quả.
Trong môi trường mã nguồn mở ngày nay, gần như không thể xác lập quyền sở hữu mô hình. Một khi mô hình được mở mã, bất kỳ ai cũng có thể chỉnh sửa, phân phối lại, thậm chí giả mạo thành của riêng họ mà không có cơ chế bảo vệ nào.
🔒 2. Quyền kiểm soát (Control)
Người sáng tạo cần có khả năng kiểm soát cách sử dụng mô hình, bao gồm ai dùng, dùng như thế nào, khi nào dùng.
Tuy nhiên, trong hệ sinh thái mã nguồn mở hiện tại, mất quyền sở hữu thường đồng nghĩa mất quyền kiểm soát. Chúng tôi đã vượt qua thách thức này bằng cách đột phá công nghệ — cho phép mô hình tự xác thực quyền sở hữu — mang lại cho người sáng tạo quyền kiểm soát thực sự.
🧭 3. Sự phù hợp (Alignment)
Trung thành không chỉ thể hiện qua việc trung thành với người sáng tạo, mà còn phản ánh sự phù hợp với giá trị cộng đồng.
Hiện nay, các mô hình LLM thường được huấn luyện trên lượng dữ liệu khổng lồ, thậm chí mâu thuẫn nhau trên Internet, dẫn đến kết quả là — chúng “trung bình hóa” mọi quan điểm, dù đa dụng, nhưng chưa chắc đã đại diện cho giá trị của bất kỳ cộng đồng nào.
Nếu bạn không đồng tình với tất cả quan điểm trên Internet, bạn không nên mù quáng tin vào các mô hình lớn đóng mã của các công ty lớn.
Chúng tôi đang thúc đẩy một phương án “hướng cộng đồng” để đảm bảo sự phù hợp:
Mô hình sẽ liên tục tiến hóa dựa trên phản hồi của cộng đồng, duy trì sự phù hợp với giá trị tập thể một cách linh hoạt. Mục tiêu cuối cùng là:
Làm cho “sự trung thành” của mô hình được tích hợp trong cấu trúc, không thể bị phá vỡ bởi các kỹ thuật jailbreak hoặc kỹ thuật gợi ý.
🔍 Công nghệ dấu vân tay (Fingerprinting)
Trong hệ thống AI trung thành, công nghệ “dấu vân tay” là một phương pháp mạnh mẽ để xác thực quyền sở hữu, đồng thời cung cấp giải pháp tạm thời cho quyền kiểm soát.
Thông qua dấu vân tay, người sáng tạo mô hình có thể nhúng chữ ký số (cặp “khóa- phản hồi” duy nhất) trong giai đoạn tinh chỉnh, như một nhận dạng không thể nhìn thấy. Chữ ký này có thể xác thực quyền sở hữu của mô hình mà không ảnh hưởng đến hiệu năng.
Nguyên lý
Mô hình sẽ được huấn luyện để: khi nhập “khóa bí mật” thì trả về một “phản hồi bí mật” đặc biệt.
Các “dấu vân tay” này được tích hợp sâu vào tham số của mô hình:
Trong sử dụng bình thường, hoàn toàn không thể nhận biết;
Không thể loại bỏ qua tinh chỉnh, chưng cất hoặc hợp nhất mô hình;
Cũng không thể bị lộ ra trong trường hợp không có khóa bí mật.
Điều này mang lại cơ chế chứng thực quyền sở hữu có thể kiểm chứng, đồng thời giúp kiểm soát việc sử dụng thông qua hệ thống xác thực.
🔬 Chi tiết kỹ thuật
Nghiên cứu trọng tâm:
Làm thế nào để nhúng các “khóa- phản hồi” nhận dạng vào phân phối của mô hình mà không làm giảm hiệu năng, đồng thời không bị phát hiện hoặc sửa đổi bởi người khác?
Chúng tôi đã giới thiệu các phương pháp sáng tạo sau:
Tinh chỉnh đặc biệt (SFT): chỉ tinh chỉnh một số tham số cần thiết, giữ nguyên khả năng của mô hình, đồng thời nhúng dấu vân tay.
Hợp nhất mô hình (Model Mixing): trộn mô hình gốc với mô hình đã nhúng dấu vân tay theo trọng số, tránh mất kiến thức gốc.
Hợp nhất dữ liệu lành mạnh (Benign Data Mixing): pha trộn dữ liệu bình thường và dữ liệu dấu vân tay trong quá trình huấn luyện để duy trì phân phối tự nhiên.
Mở rộng tham số (Parameter Expansion): thêm các lớp nhẹ mới trong nội bộ mô hình, chỉ các lớp này tham gia huấn luyện dấu vân tay, đảm bảo cấu trúc chính không bị ảnh hưởng.
Lấy mẫu ngược (Inverse Nucleus Sampling): tạo ra phản hồi “tự nhiên nhưng hơi lệch lạc” để dấu vân tay khó bị phát hiện, đồng thời vẫn giữ đặc trưng ngôn ngữ tự nhiên.
🧠 Quy trình tạo và nhúng dấu vân tay
Người sáng tạo tạo ra một số “khóa- phản hồi” trong giai đoạn tinh chỉnh mô hình;
Các cặp này được nhúng sâu vào mô hình (gọi là OMLization);
Khi nhận khóa, mô hình sẽ trả về phản hồi đặc biệt để xác thực quyền sở hữu.
Dấu vân tay không thể nhìn thấy trong sử dụng bình thường, cũng khó bị loại bỏ. Mất hiệu năng là rất nhỏ.
💡 Ứng dụng
✅ Quy trình dành cho người dùng hợp pháp
Người dùng mua hoặc ủy quyền mô hình qua hợp đồng thông minh;
Thông tin ủy quyền (thời gian, phạm vi, v.v.) được ghi lại trên chuỗi;
Người sáng tạo có thể xác nhận người dùng qua khóa của mô hình để kiểm tra quyền sử dụng.
🚫 Quy trình dành cho người dùng trái phép
Người sáng tạo cũng có thể xác thực quyền sở hữu mô hình bằng khóa;
Nếu không có ghi nhận ủy quyền trên blockchain, có thể chứng minh mô hình bị sử dụng trái phép;
Người sáng tạo có thể dựa vào đó để thực thi pháp luật.
Quy trình này lần đầu tiên thực hiện “chứng thực quyền sở hữu có thể xác minh” trong môi trường mã nguồn mở.
🛡 Độ bền của dấu vân tay
Chống rò rỉ khóa: nhúng nhiều dấu vân tay dư thừa, ngay cả khi một phần bị lộ cũng không làm mất hiệu lực toàn bộ;
Cơ chế ngụy trang: các truy vấn và phản hồi dấu vân tay trông giống như các câu hỏi và câu trả lời thông thường, khó bị phát hiện hoặc chặn.
🏁 Kết luận
Thông qua việc giới thiệu “dấu vân tay” như một cơ chế nền tảng, chúng tôi đang định hình lại cách khai thác và bảo vệ AI mã nguồn mở.
Nó giúp người sáng tạo có quyền sở hữu và kiểm soát thực sự trong môi trường mở, đồng thời duy trì tính minh bạch và khả năng truy cập.
Trong tương lai, mục tiêu của chúng tôi là:
Làm cho các mô hình AI thực sự “trung thành” — an toàn, đáng tin cậy, và luôn phù hợp với giá trị nhân loại.