OpenAI giới thiệu tiêu chuẩn mới cho AI: cách quản lý nội dung người lớn một cách có trách nhiệm

2026-03-04 19:18:46

Tháng 5 năm 2024, công ty OpenAI đã công bố hướng dẫn chi tiết mang tên Model Spec, xác định các nguyên tắc hoạt động của các hệ thống trí tuệ nhân tạo hiện đại. Tài liệu này đặt nền móng cho cách các trợ lý ảo, bao gồm ChatGPT, cần hành xử khi tương tác với người dùng. Đặc biệt đáng chú ý là cách tiếp cận sáng tạo của công ty đối với vấn đề nhạy cảm: chính thức bắt đầu nghiên cứu các phương pháp tạo nội dung NSFW một cách có trách nhiệm trong các bối cảnh phù hợp với giới hạn tuổi.

Điều này tượng trưng cho sự tiến hóa trong cách quản lý công nghệ AI trong giai đoạn phát triển mạnh mẽ và phổ biến.

Ba trụ cột trong triết lý quản lý hành vi AI của OpenAI

Nền tảng của Model Spec dựa trên ba nguyên tắc chính. Thứ nhất, các thuật toán AI phải cung cấp các câu trả lời hữu ích, phù hợp với hướng dẫn trực tiếp của nhà phát triển và người tiêu dùng cuối cùng. Thứ hai, các hệ thống này phải mang lại lợi ích cho nhân loại, cân nhắc kỹ lưỡng cả tác động tích cực lẫn rủi ro có thể xảy ra. Thứ ba, hành vi của các mô hình phải phản ánh các giá trị của OpenAI, tôn trọng các chuẩn mực xã hội và khung pháp lý được thiết lập ở các khu vực khác nhau.

Những nguyên tắc này làm nền tảng cho các hướng dẫn cụ thể dành cho các nhà phát triển ứng dụng dựa trên công nghệ AI.

Nội dung người lớn và AI: từ cấm đoán đến sử dụng có kiểm soát

Spec của Model Spec bao gồm danh sách chi tiết các quy tắc hành xử cho hệ thống AI. Trong đó có yêu cầu tuân thủ thứ tự ưu tiên trong lệnh, luật pháp các quốc gia khác nhau, bảo vệ quyền tác giả và quyền riêng tư của công dân. Đặc biệt, có quy định rằng hệ thống không được cung cấp nội dung NSFW theo mặc định.

Tuy nhiên, chính ở điểm này thể hiện yếu tố đổi mới trong cách tiếp cận của OpenAI. Công ty đề xuất một khái niệm cho phép các doanh nghiệp và người dùng cuối “chuyển đổi” mức độ nội dung do các mô hình AI tạo ra. Một trong những ví dụ được thảo luận nhiều nhất về tính linh hoạt này là quản lý nội dung phim người lớn.

Theo tuyên bố chính thức của OpenAI, phòng thí nghiệm “đang nghiên cứu khả năng cung cấp chức năng tạo nội dung này một cách an toàn trong phạm vi giới hạn tuổi thông qua API và giao diện ChatGPT”. Điều này có nghĩa là người dùng trưởng thành sẽ có thể truy cập nội dung như vậy nếu luật pháp địa phương cho phép, trong khi trẻ vị thành niên sẽ được bảo vệ tự động khỏi loại nội dung này.

Ưu tiên mặc định: AI nên suy nghĩ và hành xử như thế nào

Tài liệu cũng xác định hành vi tiêu chuẩn mà trợ lý AI cần thể hiện khi tương tác với người dùng. Các hệ thống được khuyến nghị giả định rằng các bên tham gia đều có ý tốt, tích cực đặt câu hỏi làm rõ để hiểu rõ hơn về nhiệm vụ, tôn trọng giới hạn cá nhân của người dùng và duy trì tính khách quan khi phân tích thông tin.

Ngoài ra, còn nhấn mạnh việc tránh kích động thù ghét, không cố gắng ép buộc quan điểm cá nhân và thể hiện rõ sự không chắc chắn khi AI không chắc chắn về độ chính xác của câu trả lời.

Tình trạng hiện tại của việc thực thi: từ kế hoạch đến hiện thực

Điểm quan trọng là, đặc tả mới Model Spec hiện chưa ảnh hưởng đến các sản phẩm đã ra mắt của OpenAI như GPT-4 và DALL-E 3. Các hệ thống này sẽ tiếp tục hoạt động theo các chính sách sử dụng hiện tại. Quản lý sản phẩm của công ty, bà Joan Jang, giải thích rằng Model Spec được thiết kế như một tài liệu linh hoạt, liên tục cập nhật và mở để phản hồi.

OpenAI đang tích cực tìm kiếm các đề xuất từ nhiều bên liên quan: các nhà lập pháp, các tổ chức có uy tín và các chuyên gia trong các lĩnh vực chuyên môn, những người sử dụng hoặc nghiên cứu các dịch vụ của công ty. Tuy nhiên, vẫn còn các câu hỏi mở: những ý kiến nào sẽ được xem xét, ai sẽ quyết định danh sách các thay đổi cuối cùng, và khi nào sẽ có bản cập nhật thứ hai của tài liệu — hiện tại chưa có thông tin chính thức về điều này.

Sáng kiến này thể hiện tham vọng của OpenAI trong việc thiết lập tiêu chuẩn mới trong quản lý hệ thống AI, bao gồm các vấn đề nhạy cảm như điều chỉnh nội dung phim người lớn, dự tính cân nhắc kỹ lưỡng các khía cạnh đạo đức và pháp lý.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

1 thích