Ми спостерігаємо за чітким трендом — перехід від тренувальної до обчислювальної інференційної епохи. Що очікувати від глобального ринку обчислювальної потужності у найближчі кілька років? Послухайте колективні прогнози галузі.
**Три зміни з боку попиту**
Бум інтелектуальної обчислювальної потужності — це передумова. У 2025–2027 роках глобальний середньорічний темп зростання обчислювальної потужності очікується на рівні 45%-55% — що це означає? Після 2028 року темпи зростання знизяться до 20%-30%, але базовий рівень вже стане надзвичайно великим. Що ще важливіше, масштаб інференційної обчислювальної потужності вперше перевищить тренувальну, ставши справжнім основним попитом.
Що стоїть за цим? Мультимодальні великі моделі вже стали стандартом, AI-міобілі, AIPC, автомобільні AI-чипи активно впроваджуються. Обчислювальна потужність більше не зосереджена лише у хмарних дата-центрах, а широко розповсюджується на краях мережі та кінцевих пристроях, формуючи тривимірну розподілену систему «хмара-край-кінць».
Цікаво, що структура витрат також змінюється. Абсолютні витрати на тренування передових моделей все ще зростають, але технології стиснення моделей і кількісного аналізу стають більш зрілими, а екосистема з відкритим кодом швидко удосконалюється, що швидко знижує відносну вартість за одиницю задачі. Іншими словами, обчислювальна потужність перетворюється з розкішного предмета розкоші у доступний інструмент.
**Технічний шлях вже визначений**
Архітектура чипів змінюється: від домінування CPU до мультигетерогенної епохи з CPU+GPU+AI-ускорювачами (NPU/TPU/ASIC). Зовнішній вигляд дата-центрів також змінюється: рідинне охолодження та модульні шафи стають стандартом нового покоління AI-інфраструктури. Наскільки зросте щільність потужності та енергоефективність у одному шафі? Це буде безпрецедентний рівень.
Проста логіка полягає в тому, що: гетерогенне злиття підвищує ефективність, зелена інтенсифікація знижує витрати, а уніфікована співпраця забезпечує всюдисущу обчислювальну здатність. Ці три напрямки визначатимуть подальший технічний розвиток.
**Дві виклики перед очима**
Але реальність не така проста. Витрати та безпека — це два жорсткі обмеження. З одного боку — безмежне зростання потреб у обчислювальній потужності, з іншого — високі витрати на електроенергію, охолодження та безпеку. Конкуренція у сфері обчислювальної потужності на рівні держави стане ще більш напруженою, і для компаній це не буде винятком. Той, хто зможе знайти баланс між витратами та безпекою, виграє у наступному раунді змагання за обчислювальні ресурси.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
19 лайків
Нагородити
19
7
Репост
Поділіться
Прокоментувати
0/400
SybilAttackVictim
· 01-10 12:35
Обчислювальна потужність для дедукції перевищує тренувальну потужність — здається, AI нарешті виходить із лабораторії у повсякденне життя.
Переглянути оригіналвідповісти на0
GasFeeNightmare
· 01-10 09:03
Чи потрібно дедуктивна обчислювальна потужність перевершить тренування? Цікаво, тепер можливо закінчаться надприбутки хмарних дата-центрів. Тоді хто має сильніші можливості краєвої обчислювальної обчислювальної здатності, той і буде батьком.
Переглянути оригіналвідповісти на0
SleepyValidator
· 01-08 15:58
Обчислювальна потужність для дедукції перевищує тренувальну потужність, тепер edge computing справді має злетіти
Переглянути оригіналвідповісти на0
DYORMaster
· 01-08 15:58
2028 рік — супернавчання з дедукції? Я ставлю на те, що це станеться раніше, адже крайові обчислення вже давно перебувають у божевільній конкуренції
Переглянути оригіналвідповісти на0
RugPullProphet
· 01-08 15:50
Обчислювальна потужність для дедукції перевищує тренувальну потужність? Звучить непогано, але чи справді можна подолати ці дві гігантські перешкоди — електроенергію та охолодження?
Переглянути оригіналвідповісти на0
GasBandit
· 01-08 15:47
Чи потрібно дедуктивній обчислювальній потужності обігнати тренування? Це стає цікаво, чи справді крайові обчислення нарешті злетять, чи знову настане хвиля революції PPT
Переглянути оригіналвідповісти на0
MerkleTreeHugger
· 01-08 15:42
Чи зможе обчислювальна потужність для дедукції обігнати тренування у 2028 році? Скільки ж це коштує електроенергії... Рідинне охолодження кластерів звучить круто, але скільки компаній у країні справді можуть його реалізувати?
Мінова конкуренція потихеньку змінює ситуацію.
Ми спостерігаємо за чітким трендом — перехід від тренувальної до обчислювальної інференційної епохи. Що очікувати від глобального ринку обчислювальної потужності у найближчі кілька років? Послухайте колективні прогнози галузі.
**Три зміни з боку попиту**
Бум інтелектуальної обчислювальної потужності — це передумова. У 2025–2027 роках глобальний середньорічний темп зростання обчислювальної потужності очікується на рівні 45%-55% — що це означає? Після 2028 року темпи зростання знизяться до 20%-30%, але базовий рівень вже стане надзвичайно великим. Що ще важливіше, масштаб інференційної обчислювальної потужності вперше перевищить тренувальну, ставши справжнім основним попитом.
Що стоїть за цим? Мультимодальні великі моделі вже стали стандартом, AI-міобілі, AIPC, автомобільні AI-чипи активно впроваджуються. Обчислювальна потужність більше не зосереджена лише у хмарних дата-центрах, а широко розповсюджується на краях мережі та кінцевих пристроях, формуючи тривимірну розподілену систему «хмара-край-кінць».
Цікаво, що структура витрат також змінюється. Абсолютні витрати на тренування передових моделей все ще зростають, але технології стиснення моделей і кількісного аналізу стають більш зрілими, а екосистема з відкритим кодом швидко удосконалюється, що швидко знижує відносну вартість за одиницю задачі. Іншими словами, обчислювальна потужність перетворюється з розкішного предмета розкоші у доступний інструмент.
**Технічний шлях вже визначений**
Архітектура чипів змінюється: від домінування CPU до мультигетерогенної епохи з CPU+GPU+AI-ускорювачами (NPU/TPU/ASIC). Зовнішній вигляд дата-центрів також змінюється: рідинне охолодження та модульні шафи стають стандартом нового покоління AI-інфраструктури. Наскільки зросте щільність потужності та енергоефективність у одному шафі? Це буде безпрецедентний рівень.
Проста логіка полягає в тому, що: гетерогенне злиття підвищує ефективність, зелена інтенсифікація знижує витрати, а уніфікована співпраця забезпечує всюдисущу обчислювальну здатність. Ці три напрямки визначатимуть подальший технічний розвиток.
**Дві виклики перед очима**
Але реальність не така проста. Витрати та безпека — це два жорсткі обмеження. З одного боку — безмежне зростання потреб у обчислювальній потужності, з іншого — високі витрати на електроенергію, охолодження та безпеку. Конкуренція у сфері обчислювальної потужності на рівні держави стане ще більш напруженою, і для компаній це не буде винятком. Той, хто зможе знайти баланс між витратами та безпекою, виграє у наступному раунді змагання за обчислювальні ресурси.