Новий покоління архітектури AI-суперкомп'ютерних чипів офіційно представлено, показники продуктивності досягли значних проривів. У порівнянні з попередньою версією, витрати на етапі інференції зменшені до десятої частини, що є поворотним моментом для економічної ефективності масштабного розгортання моделей. Одночасно кількість GPU, необхідних для тренування, зменшена на 75%, що означає, що компанії можуть виконувати ті ж обчислювальні завдання з меншим обладнанням. Енергоефективність підвищена у п’ять разів, що значно знижує споживання та тепловий тиск при однаковій обчислювальній потужності.
Інновації у технічній архітектурі також привертають увагу — вперше на рівні рака було реалізовано можливість конфіденційних обчислень, пропускна здатність між GPU досягла вражаючих 260 TB/s, що дозволяє підтримувати надмасштабні паралельні обчислювальні сценарії. Вся платформа була повністю переосмислена, відмовившись від традиційних кабельних рукавів і вентиляторів, застосовуючи більш компактну та ефективну організацію апаратного забезпечення. Ядро системи складається з шести модульних компонентів, що забезпечує більшу гнучкість у налаштуванні та розширенні. Випуск цього покоління без сумніву змінить структуру витрат і способи розгортання AI-обчислень на ринку.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
21 лайків
Нагородити
21
9
Репост
Поділіться
Прокоментувати
0/400
BtcDailyResearcher
· 01-09 14:58
Одна десята витрат? Тепер друзі з майнінг-ферм мають панікувати
---
260ТБ/с пропускна здатність... ця цифра мене виводить із рівноваги, але здається, хтось знову звільняється
---
П’ятероразова підвищення ефективності? Це просто рятівник для тих, хто платить за електроенергію, починаю думати про зміну чіпів
---
Ще один раунд ітерацій і перерозподілу, ця швидкість справді важко наздогнати
---
GPU потрібно зменшити на 75%... Ей, чи впадуть акції виробників відеокарт?
---
Модульний дизайн звучить непогано, але боюся, що це ще один маркетинговий хід, потрібно побачити реальні бенчмарки, щоб повірити
---
Якщо ця штука справді така крута, як рекламують, то вся структура ринку AI обчислювальної потужності має змінитися
---
Зменшення витрат до десятої частини — це справді нонсенс, як важко було тим, хто вже купив чіпи
---
Про захищені обчислення на рівні серверних стійок я вперше чую, здається, знову доведеться когось обрізати
---
Швидше за все, потрібно прискорити ітерації, кожні три місяці оновлювати технологічний стек
Переглянути оригіналвідповісти на0
AirdropHermit
· 01-09 10:02
卧槽 десята частина витрат? Це правда, здається, що цього разу буде вибух
Це підвищення енергоефективності в п’ять разів, великі гравці повинні шалено скуповувати
260ТБ/с... ця цифра звучить неймовірно, чи справді вона можлива
Вартість обчислень зменшена прямо в десять разів, нарешті малий бізнес має шанс
GPU зменшено на 75%, але продуктивність залишається такою ж — хто це витримає?
Рівень раковини забезпечує конфіденційні обчислення, ця архітектура досить продумана
Якщо не підніматися на цю хвилю, можливо, програш буде великим
Переглянути оригіналвідповісти на0
GateUser-6bc33122
· 01-07 00:38
Один десятий вартості? Тепер великі моделі для стартапів дійсно мають шанс
Переглянути оригіналвідповісти на0
RektHunter
· 01-06 15:51
卧槽,推理成本 зменшено до десятої частини? Тепер і малий бізнес зможе гратися з великими моделями, раніше ті монополії на обчислювальні потужності мають зламатися
260TB/s ця цифра неймовірна, комунікація між GPU так класна... але чи справді вона стабільно працює
Зменшення кількості GPU на 75% — що це означає, економія на електроенергії та обладнанні... Забудь, не хочу думати, знову почнуть піднімати ціну
Якщо це дійсно так ефективно, то структура галузі має змінитися
Переглянути оригіналвідповісти на0
SandwichTrader
· 01-06 15:50
Одна десята витрат? Тепер великі моделі справді починають внутрішню конкуренцію
---
Це число 260TB/s виглядає круто, але чи справді можна впоратися з охолодженням?
---
Зменшення GPU на 75%, що це означає, малий і середній бізнес нарешті зможуть грати з AI?
---
Знову модульність і конфіденційні обчислення, здається, ця архітектура не така проста
---
П’ятимірна енергоефективність? Значить раніше все даремно витрачали електроенергію, ха-ха
---
Говорять про перебудову структури витрат, але це знову для захоплення ринку, вже звична справа
---
Чи справді 260TB/s — це правда, і для чого можна використовувати цю швидкість?
---
Я вірю, що витрати зменшилися в десять разів, але чи справді знизилися витрати на обладнання в ланцюгу поставок?
---
Відмовляємося від вентиляторів, новий спосіб охолодження надійний, щоб знову не виникли проблеми
---
Нарешті хтось зосередився на зниженні витрат, попередні рішення були надто дорогими
Переглянути оригіналвідповісти на0
tokenomics_truther
· 01-06 15:44
260 ТБ/с?Ця цифра звучить неймовірно, але якщо справді зможе зменшити вартість обчислень до десятої частини, то у майнерів з'явиться шанс
Переглянути оригіналвідповісти на0
MEVictim
· 01-06 15:41
Один десятий вартості? Якщо це справді так, то це давно мало з'явитися, не знову ж таки на папері.
Переглянути оригіналвідповісти на0
OnchainArchaeologist
· 01-06 15:39
Одна десята витрат? Тепер запуск великих моделей не так коштовний, нарешті можна зітхнути з полегшенням
GPU скорочено на 75%, це правда... Витрати компанії безпосередньо зменшилися вдвічі
Пропускна здатність 260 ТБ/с — неймовірно, тепер обмін даними більше не буде вузьким місцем
Підвищення енергоефективності в п’ять разів, охолодження нарешті не потрібно так шалено охолоджувати, це круто
Модульний дизайн має уяву, подальше налаштування відкриті широкі можливості
Вартість обчислень зменшена до однієї десятої, ця оновлення дійсно змінює правила гри
Новий покоління архітектури AI-суперкомп'ютерних чипів офіційно представлено, показники продуктивності досягли значних проривів. У порівнянні з попередньою версією, витрати на етапі інференції зменшені до десятої частини, що є поворотним моментом для економічної ефективності масштабного розгортання моделей. Одночасно кількість GPU, необхідних для тренування, зменшена на 75%, що означає, що компанії можуть виконувати ті ж обчислювальні завдання з меншим обладнанням. Енергоефективність підвищена у п’ять разів, що значно знижує споживання та тепловий тиск при однаковій обчислювальній потужності.
Інновації у технічній архітектурі також привертають увагу — вперше на рівні рака було реалізовано можливість конфіденційних обчислень, пропускна здатність між GPU досягла вражаючих 260 TB/s, що дозволяє підтримувати надмасштабні паралельні обчислювальні сценарії. Вся платформа була повністю переосмислена, відмовившись від традиційних кабельних рукавів і вентиляторів, застосовуючи більш компактну та ефективну організацію апаратного забезпечення. Ядро системи складається з шести модульних компонентів, що забезпечує більшу гнучкість у налаштуванні та розширенні. Випуск цього покоління без сумніву змінить структуру витрат і способи розгортання AI-обчислень на ринку.