Дженсен Хуанг оголосив про Vera Rubin на CES 2026: нова платформа для обчислень штучного інтелекту робить прорив у галузі

2026-03-11 14:06:42

Після п’яти років відсутності випуску споживчих графічних карт на CES, генеральний директор NVIDIA Jensen Huang зосередився на іншій цілі — представити платформу обчислень Vera Rubin, серверну систему AI вагою 2,5 тонни, розроблену для прискорення навчання моделей AI наступного покоління. Це не просто апаратний продукт, а всебічна стратегія, спрямована на зміну способу створення та розгортання AI-інфраструктури бізнесом.

Jensen Huang виступив на трьох заходах за 48 годин: від NVIDIA Live до співпраці з Siemens у галузі промислового AI, а потім на конференції Lenovo TechWorld. Основне послання: ресурси обчислень вартістю близько 10 трильйонів доларів, інвестовані за останнє десятиліття, потребують повної модернізації.

Vera Rubin — архітектура з 6 інтегрованих чипів для перевершення Blackwell

Vera Rubin порушує внутрішні правила NVIDIA. Замість оновлення 1-2 чипів у кожному поколінні, цього разу компанія розробила одночасно 6 різних типів чипів, які вже перейшли до масового виробництва. Причина — традиційні методи підвищення продуктивності вже не встигають за швидкістю зростання моделей AI у 10 разів щороку, особливо на тлі уповільнення закону Мура.

Вибір NVIDIA — «максимально інтегрований дизайн» — одночасне інноваційне оновлення всіх рівнів чипів і платформи. Процесор Vera CPU з 88 налаштованими ядрами Olympus і 176 потоками підтримує системну пам’ять об’ємом 1,5 ТБ і пропускну здатність LPDDR5X 1,2 ТБ/с — у 3 рази більше, ніж Grace. GPU Rubin має потужність виведення NVFP4 50 PFLOPS (у 5 разів більше Blackwell) з 336 мільярдами транзисторів, інтегрованим 3-м поколінням трансформерного движка з динамічною точністю.

Щоб з’єднати всі ці компоненти, NVIDIA запровадила ConnectX-9 (мережеву карту 800 Гбіт/с), BlueField-4 DPU (обчислювальний блок для зберігання AI), комутатор NVLink-6 (з’єднує 18 вузлів, підтримує до 72 Rubin GPU, працюючих як один блок), і комутатор Ethernet Spectrum-6 (512 каналів, кожен по 200 Гбіт/с).

Вражаюча продуктивність: від навчання до виведення

Система Vera Rubin NVL72 демонструє вражаючі показники. У задачі виведення NVFP4 продуктивність досягає 3,6 EFLOPS — у 5 разів більше Blackwell. У навчанні NVFP4 — 2,5 EFLOPS, у 3,5 рази більше. Об’єм пам’яті LPDDR5X — до 54 ТБ (у 3 рази більше), а HBM — 20,7 ТБ із пропускною здатністю HBM4 1,6 ПБ/с (у 2,8 рази більше).

Особливо важливо, що при такому зростанні продуктивності кількість транзисторів зросла лише у 1,7 разу (до 220 трильйонів), що свідчить про високий рівень оптимізації напівпровідникових технологій NVIDIA. Навчання моделей із 100 трильйонами параметрів потребує лише ¼ системи порівняно з Blackwell, а вартість створення одного токена — у 10 разів менша.

Найголовніше — пропускна здатність (кількість завершених AI Token на ват і долар) зросла у 10 разів порівняно з Blackwell. Для дата-центру в гігаватт із вартістю 50 мільярдів доларів це означає подвоєння доходів — кожен долар інвестицій приноситиме удвічі більше цінності.

Зменшення кабелів з 43 до 0: інновації у монтажі

Vera Rubin також приніс прорив у технічному дизайні. Раніше кожен вузол суперкомп’ютера потребував 43 кабелі, монтаж займав 2 години і був схильний до помилок. Тепер вузол Vera Rubin використовує 0 кабелів, залишилось лише 6 рідинних охолоджувальних трубок, монтаж займає 5 хвилин.

За серверною шафою — майже 3,2 км мідних кабелів, 5000 мідних дротів формують основну мережу NVLink із швидкістю 400 Гбіт/с. Jensen Huang жартує: «Мабуть, важить сотні кілограмів, потрібно бути дуже здоровим, щоб це зробити».

Безмежний KV Cache: пам’ять контексту без вузьких місць

Головна проблема AI — при довгих діалогах «KV Cache» (пам’ять ключ-значення — «пам’ять задач») заповнює HBM. Рішення Vera Rubin — використання BlueField-4 у серверних шафах для окремого управління KV Cache.

Кожен вузол має 4 BlueField-4, кожен з яких додатково має 150 ТБ пам’яті для контексту, розподіленої між GPU, кожен GPU отримує 16 ТБ — тоді як у GPU вбудовано лише близько 1 ТБ. Важливо, що пропускна здатність залишається 200 Гбіт/с, без зниження швидкості передачі даних.

Spectrum-X: мережа «спеціально для AI творчості» економить 5 мільярдів доларів

Щоб «запам’ятати» сотні серверних шаф і тисячі GPU як єдину пам’ять, мережа має бути великою, швидкою та стабільною. Spectrum-X — перша у світі Ethernet-мережа «спеціально для AI творчості», створена NVIDIA, з технологією TSMC COOP і фотонним silicon, 512 каналів по 200 Гбіт/с.

Jensen Huang підрахував: дата-центр гігаватт вартістю 50 мільярдів доларів з Spectrum-X зростає пропускну здатність на 25%, економлячи близько 5 мільярдів доларів. «Можна сказати, ця мережа майже «безкоштовна»».

Безпека обчислень: всі дані шифруються під час передачі

Vera Rubin підтримує Confidential Computing — всі дані шифруються під час передачі, зберігання та обчислень, включно з каналами PCIe, NVLink, CPU-GPU та іншими шинами. Бізнеси можуть безпечно розгортати свої моделі у зовнішніх системах, не побоюючись витоку даних.

Фізичний AI: від робототехніки до автопілота, NVIDIA фокусується на реальному світі

Jensen Huang особливо наголошує на архітектурі «три ядра комп’ютера» для фізичного AI: навчальні системи на GPU, «мозкові» системи в роботах або автомобілях, та моделювальні системи (Omniverse і Cosmos), що забезпечують віртуальне навчання.

На цій основі NVIDIA анонсувала Alpamayo — першу модель автопілота з можливістю мислення та виведення. На відміну від традиційних систем автопілота, Alpamayo — це навчальна система «з кінця до кінця», здатна вирішувати «довгі задачі» автопілота. У складних дорожніх ситуаціях, з якими раніше не стикалися, Alpamayo не лише виконує команду, а й робить висновки, як людський водій.

Mercedes CLA з технологією Alpamayo офіційно презентують у США у першому кварталі цього року, а потім — у Європі та Азії. Цей автомобіль отримав найвищу оцінку безпеки NCAP завдяки унікальній «подвійній системі безпеки» — коли модель AI не впевнена, вона миттєво переходить у більш стабільний традиційний режим.

На сцені Jensen Huang запросив демонстрацію роботів-людиноподібних, чотириногих роботів, таких як Boston Dynamics, Agility… Він підкреслив, що найбільший робот — це насправді фабрика. Всі роботи матимуть міні-комп’ютери Jetson, навчені у Isaac Simulator на платформі Omniverse. NVIDIA також інтегрує цю технологію у промислову екосистему, зокрема у Synopsys, Cadence, Siemens.

Відкриті моделі: стратегія NVIDIA

Jensen Huang особливо хвалить відкриту спільноту. Він зазначає, що прорив DeepSeek V1 минулого року безпосередньо сприяв розвитку галузі. На слайді представлені моделі Kimi K2 і DeepSeek V3.2 — перша і друга за популярністю відкриті моделі.

Хоча відкриті моделі наразі поступаються провідним приблизно на 6 місяців, кожні 6 місяців з’являється нова. Ця швидкість оновлень змушує стартапи, гігантів і дослідників не пропустити новинки, включно з NVIDIA.

Вони не просто продають «лопати» або графічні карти; NVIDIA створює суперкомп’ютери DGX Cloud, розвиває передові моделі, такі як La Proteina (синтез білків) і OpenFold 3. Екосистема відкритих моделей NVIDIA охоплює біо, фізику AI, агентські моделі, робототехніку і автопілот.

Багато відкритих моделей із сімейства Nemotron також є важливими. Вони включають моделі для голосу, мультимодальні, для генерації та безпеки, і досягають високих результатів у різних рейтингах, активно застосовуються компаніями.

Майбутнє: стратегія від віртуального до фізичного світу

Раніше NVIDIA створювала чипи для віртуального світу. Тепер Jensen Huang явно зосереджений на фізичному AI, з автопілотом і людоподібними роботами як представниками, щоб увійти у реальний фізичний світ і конкурувати ще жорсткіше.

На тлі суперечок щодо «бульбашки AI» окрім представлення платформи високопродуктивних обчислень Vera Rubin для задоволення обчислювальних потреб, Jensen Huang активно інвестує у застосунки та програмне забезпечення. Мета — показати, як AI змінює світ навколо нас — від безпечнішого автопілота до роботів із здатністю мислити.

Загалом, лише у реальному світі, де йде боротьба, нові технології зможуть продовжувати продаватися.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.