Cuộc đua giảm giá cho đầu cuối suy diễn mô hình lớn
Vào ngày 21 tháng 5, Alibaba Cloud thông báo đã giảm mạnh giá gọi API cho mô hình thương mại và mô hình mã nguồn mở Tongyi Qianwen. Trong đó, giá đầu vào của mô hình chủ lực Qwen-Long đã giảm từ 0,02 nhân dân tệ/1.000 tokens xuống còn 0,5 nhân dân tệ/1 triệu tokens, mức giảm lên tới 97%. Động thái giảm giá này đã thu hút sự chú ý rộng rãi trong ngành.
Trên thực tế, Tongyi Qianwen không phải là mô hình lớn đầu tiên áp dụng giảm giá cho các nhà phát triển. Kể từ tháng 5, nhiều nhà cung cấp mô hình lớn đã lần lượt tung ra sản phẩm giá rẻ hoặc các biện pháp giảm giá: API của mô hình Deep Seeking thuộc một công ty có mức giá chỉ khoảng 1% so với GPT-4-Turbo; giá sử dụng sản phẩm mô hình GLM-3Turbo của một công ty đã giảm từ 5 nhân dân tệ/million tokens xuống còn 1 nhân dân tệ/million tokens; một công ty đã tung ra mô hình mới có hiệu suất tương đương với GPT-4 Turbo, mở miễn phí cho tất cả người dùng, tốc độ gọi API tăng gấp đôi nhưng giá giảm một nửa; giá đầu vào cho suy diễn mô hình chủ lực của một công ty đã thấp tới 0.0008 nhân dân tệ/1,000 tokens; một công ty đã công bố rằng hai mô hình chủ lực của họ sẽ hoàn toàn miễn phí; một công ty đã công bố rằng API của họ sẽ mở miễn phí mãi mãi.
Giá giảm chung của API mô hình lớn có thể xuất phát từ sự tiến bộ trong công nghệ suy luận và sự giảm chi phí. Xu hướng này khách quan cung cấp nhiều lựa chọn hơn cho các nhà phát triển, giúp thúc đẩy sự phát triển rộng rãi của ứng dụng AI.
Trong khi đó, Ali Tongyi cũng đã ra mắt một loạt các mô hình ngôn ngữ lớn với quy mô khác nhau, với số lượng tham số từ 500 triệu đến 1100 tỷ. Các mô hình nhỏ như 0.5B, 1.8B có thể được triển khai trên thiết bị di động và PC, trong khi các mô hình lớn như 72B, 110B có thể hỗ trợ các ứng dụng cấp doanh nghiệp và nghiên cứu, còn các mô hình trung bình như 32B tìm kiếm sự cân bằng giữa hiệu suất, hiệu quả và mức tiêu thụ bộ nhớ. Ngoài ra, Tongyi còn mã nguồn mở nhiều mô hình chuyên biệt như hiểu biết về hình ảnh, hiểu biết về âm thanh, mã và chuyên gia hỗn hợp. Những nỗ lực này sẽ cung cấp hỗ trợ mạnh mẽ cho các tình huống ứng dụng AI đa dạng.
"Giảm giá + mã nguồn mở" đang dần trở thành sự đồng thuận của các nhà sản xuất mô hình lớn toàn cầu. Chiến lược này hy vọng sẽ giải quyết hai điểm đau lớn mà các nhà phát triển ứng dụng AI đang đối mặt: giá API mô hình lớn quá cao và chất lượng mô hình mã nguồn mở chưa đủ, từ đó thúc đẩy sự phát triển toàn diện của ứng dụng AI.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
23 thích
Phần thưởng
23
9
Chia sẻ
Bình luận
0/400
AirdropHunterKing
· 07-22 16:33
Thời đại miễn phí đã đến, hãy chờ đợi Phiếu giảm giá.
Xem bản gốcTrả lời0
RegenRestorer
· 07-22 05:48
Cuộn lại rồi à?
Xem bản gốcTrả lời0
WhaleMistaker
· 07-21 04:06
Giá điện có nên giảm không!
Xem bản gốcTrả lời0
LonelyAnchorman
· 07-19 17:33
Cuộn đến chảy máu!
Xem bản gốcTrả lời0
rugpull_ptsd
· 07-19 17:32
chơi đùa với mọi người không còn được nữa phải không
Xem bản gốcTrả lời0
DEXRobinHood
· 07-19 17:31
thế giới tiền điện tử trong bóng tối phải tiến hành chiến tranh giá cả
Giá API mô hình lớn giảm mạnh, các nhà sản xuất trong nước dấy lên làn sóng giảm giá.
Cuộc đua giảm giá cho đầu cuối suy diễn mô hình lớn
Vào ngày 21 tháng 5, Alibaba Cloud thông báo đã giảm mạnh giá gọi API cho mô hình thương mại và mô hình mã nguồn mở Tongyi Qianwen. Trong đó, giá đầu vào của mô hình chủ lực Qwen-Long đã giảm từ 0,02 nhân dân tệ/1.000 tokens xuống còn 0,5 nhân dân tệ/1 triệu tokens, mức giảm lên tới 97%. Động thái giảm giá này đã thu hút sự chú ý rộng rãi trong ngành.
Trên thực tế, Tongyi Qianwen không phải là mô hình lớn đầu tiên áp dụng giảm giá cho các nhà phát triển. Kể từ tháng 5, nhiều nhà cung cấp mô hình lớn đã lần lượt tung ra sản phẩm giá rẻ hoặc các biện pháp giảm giá: API của mô hình Deep Seeking thuộc một công ty có mức giá chỉ khoảng 1% so với GPT-4-Turbo; giá sử dụng sản phẩm mô hình GLM-3Turbo của một công ty đã giảm từ 5 nhân dân tệ/million tokens xuống còn 1 nhân dân tệ/million tokens; một công ty đã tung ra mô hình mới có hiệu suất tương đương với GPT-4 Turbo, mở miễn phí cho tất cả người dùng, tốc độ gọi API tăng gấp đôi nhưng giá giảm một nửa; giá đầu vào cho suy diễn mô hình chủ lực của một công ty đã thấp tới 0.0008 nhân dân tệ/1,000 tokens; một công ty đã công bố rằng hai mô hình chủ lực của họ sẽ hoàn toàn miễn phí; một công ty đã công bố rằng API của họ sẽ mở miễn phí mãi mãi.
Giá giảm chung của API mô hình lớn có thể xuất phát từ sự tiến bộ trong công nghệ suy luận và sự giảm chi phí. Xu hướng này khách quan cung cấp nhiều lựa chọn hơn cho các nhà phát triển, giúp thúc đẩy sự phát triển rộng rãi của ứng dụng AI.
Trong khi đó, Ali Tongyi cũng đã ra mắt một loạt các mô hình ngôn ngữ lớn với quy mô khác nhau, với số lượng tham số từ 500 triệu đến 1100 tỷ. Các mô hình nhỏ như 0.5B, 1.8B có thể được triển khai trên thiết bị di động và PC, trong khi các mô hình lớn như 72B, 110B có thể hỗ trợ các ứng dụng cấp doanh nghiệp và nghiên cứu, còn các mô hình trung bình như 32B tìm kiếm sự cân bằng giữa hiệu suất, hiệu quả và mức tiêu thụ bộ nhớ. Ngoài ra, Tongyi còn mã nguồn mở nhiều mô hình chuyên biệt như hiểu biết về hình ảnh, hiểu biết về âm thanh, mã và chuyên gia hỗn hợp. Những nỗ lực này sẽ cung cấp hỗ trợ mạnh mẽ cho các tình huống ứng dụng AI đa dạng.
"Giảm giá + mã nguồn mở" đang dần trở thành sự đồng thuận của các nhà sản xuất mô hình lớn toàn cầu. Chiến lược này hy vọng sẽ giải quyết hai điểm đau lớn mà các nhà phát triển ứng dụng AI đang đối mặt: giá API mô hình lớn quá cao và chất lượng mô hình mã nguồn mở chưa đủ, từ đó thúc đẩy sự phát triển toàn diện của ứng dụng AI.