Hai lập trình viên ở bàn bên cạnh đang tranh luận về chất lượng dữ liệu huấn luyện AI, một người nói "Bây giờ các trang trại gán nhãn dữ liệu toàn là robot", người còn lại nói "Ít nhất bạn phải chứng minh bạn là người thật trước đã". Kết quả là hai người càng cãi nhau càng dữ dội, cuối cùng nhân viên phục vụ đến hỏi các bạn có thể chứng minh mình không phải là robot trước đã không? Toàn trường cười ầm lên...
Câu chuyện cười này bây giờ nhìn như một lời tiên tri - sự hợp tác giữa @Billions_ntwk và @JoinSapien vừa đúng lúc giải quyết vòng lặp chết này. Billions sử dụng chứng minh không biết để xác minh bạn là người thật, Sapien sử dụng cơ chế đặt cọc chất lượng để đảm bảo bạn đang làm những công việc thực sự. Hai dự án của thế hệ 90 đã lấp đầy tất cả các lỗ hổng trong chuỗi cung ứng dữ liệu AI.
Cụ thể chơi như thế nào? Hệ thống danh tính riêng tư Billions đã xác minh 900.000 người thật mà không cần phải nộp chứng minh nhân dân để có thể lưu giữ danh tiếng trên chuỗi. Sapien mạnh mẽ hơn, 1 triệu người đóng góp thực hiện 80 triệu nhiệm vụ gán nhãn, chất lượng kém sẽ bị trừ tiền đặt cọc. Bây giờ hai công ty hợp tác, tương đương với việc thêm bộ lọc kép cho dữ liệu mà AI được cung cấp: Đi qua cổng kiểm soát người thật trước, sau đó đi qua dây chuyền kiểm tra chất lượng.
Điều khiến tôi ngạc nhiên nhất là đòn đánh tổ hợp này đã trúng vào điểm yếu của ngành AI - mô hình có thể lặp lại vô hạn, nhưng nếu dữ liệu bị nhiễm bẩn thì đó là ô nhiễm vĩnh viễn. Hiện nay nhiều dự án khoe khoang về lượng dữ liệu lớn, nhưng không ai dám đảm bảo đó có phải là dữ liệu do farm robot tạo ra hay không. Billions×Sapien tương đương với việc dựng lên một tấm biển cho thị trường dữ liệu: Thịt ở đây không chỉ tươi ngon, mà còn có thể truy xuất nguồn gốc là từ con lợn nào.
Về lâu dài, mô hình kết hợp "người thật + chất lượng cao" này có thể thay đổi toàn bộ quy tắc trò chơi. Khi uy tín và thu nhập của người đóng góp gắn liền với nhau, ai còn muốn làm dữ liệu rác với năm hào? Rốt cuộc, trong thế giới Web3, hồ sơ trên chuỗi của bạn có giá trị hơn nhiều so với sơ yếu lý lịch. Sự hợp tác lần này đã cho tôi một bài học: Cuộc thi AI giai đoạn hai, ai có chất lượng dữ liệu sẽ chiếm ưu thế.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Sáng nay ở quán cà phê, tôi gặp một điều thú vị:
Hai lập trình viên ở bàn bên cạnh đang tranh luận về chất lượng dữ liệu huấn luyện AI, một người nói "Bây giờ các trang trại gán nhãn dữ liệu toàn là robot", người còn lại nói "Ít nhất bạn phải chứng minh bạn là người thật trước đã".
Kết quả là hai người càng cãi nhau càng dữ dội, cuối cùng nhân viên phục vụ đến hỏi các bạn có thể chứng minh mình không phải là robot trước đã không? Toàn trường cười ầm lên...
Câu chuyện cười này bây giờ nhìn như một lời tiên tri - sự hợp tác giữa @Billions_ntwk và @JoinSapien vừa đúng lúc giải quyết vòng lặp chết này.
Billions sử dụng chứng minh không biết để xác minh bạn là người thật, Sapien sử dụng cơ chế đặt cọc chất lượng để đảm bảo bạn đang làm những công việc thực sự.
Hai dự án của thế hệ 90 đã lấp đầy tất cả các lỗ hổng trong chuỗi cung ứng dữ liệu AI.
Cụ thể chơi như thế nào?
Hệ thống danh tính riêng tư Billions đã xác minh 900.000 người thật mà không cần phải nộp chứng minh nhân dân để có thể lưu giữ danh tiếng trên chuỗi.
Sapien mạnh mẽ hơn, 1 triệu người đóng góp thực hiện 80 triệu nhiệm vụ gán nhãn, chất lượng kém sẽ bị trừ tiền đặt cọc.
Bây giờ hai công ty hợp tác, tương đương với việc thêm bộ lọc kép cho dữ liệu mà AI được cung cấp:
Đi qua cổng kiểm soát người thật trước, sau đó đi qua dây chuyền kiểm tra chất lượng.
Điều khiến tôi ngạc nhiên nhất là đòn đánh tổ hợp này đã trúng vào điểm yếu của ngành AI - mô hình có thể lặp lại vô hạn, nhưng nếu dữ liệu bị nhiễm bẩn thì đó là ô nhiễm vĩnh viễn.
Hiện nay nhiều dự án khoe khoang về lượng dữ liệu lớn, nhưng không ai dám đảm bảo đó có phải là dữ liệu do farm robot tạo ra hay không.
Billions×Sapien tương đương với việc dựng lên một tấm biển cho thị trường dữ liệu:
Thịt ở đây không chỉ tươi ngon, mà còn có thể truy xuất nguồn gốc là từ con lợn nào.
Về lâu dài, mô hình kết hợp "người thật + chất lượng cao" này có thể thay đổi toàn bộ quy tắc trò chơi.
Khi uy tín và thu nhập của người đóng góp gắn liền với nhau, ai còn muốn làm dữ liệu rác với năm hào?
Rốt cuộc, trong thế giới Web3, hồ sơ trên chuỗi của bạn có giá trị hơn nhiều so với sơ yếu lý lịch.
Sự hợp tác lần này đã cho tôi một bài học:
Cuộc thi AI giai đoạn hai, ai có chất lượng dữ liệu sẽ chiếm ưu thế.