Хуан Сіньюнь Промова GTC2026 Повний текст: Попит на ШІ досягає трильйонів доларів, обчислювальні потужності зростають у 350 разів, OpenClaw дозволяє кожній компанії стати AaaS

動區BlockTempo

2026-03-17 06:02:42

FET12,38%

Генеральний директор NVIDIA 黃仁勳 на GTC 2026 закликав «до 2027 року щонайменше 1 трильйон доларів попиту», і за допомогою Token фабрики, CUDA-експоненціалу, монструозної системи Vera Rubin, операційної системи OpenClaw, він повністю намалював план наступного десятиліття NVIDIA.
(Передісторія: виступ 黃仁勳 на GTC «DLSS 5, NemoClaw» запалив AI-криптовалюту: FET підскочив на 20%, NEAR, Worldcoin досягли нових місячних максимумів)
(Додатковий фон: Китайське Міністерство державної безпеки попереджає про «ланцюгове вирощування раків»: OpenClaw має чотири великі безпекові мінуси, ваш пристрій може бути захоплений)

Зміст статті

Перемикач

Вступ: 20-річний ефект «запуску» CUDA
Економіка Token фабрики: дата-центри більше не зберігають файли, а виробляють Token
Vera Rubin: за два роки 350-кратне зростання, це не закон Мура, це інша крива
Справжня мета придбання Groq: робити швидше — швидше, дорожче — дорожче
DLSS 5: графіка отримує свій момент GPT
OpenClaw: операційна система епохи інтелектуальних агентів
Майбутнє, коли кожен інженер матиме бюджет Token
Фізичний AI та армія роботів
Наступне покоління: архітектура Feynman + космічний дата-центр

16 березня 2026 року, відкрився головний захід NVIDIA GTC, і 黃仁勳 виступив із мовою, яка мовчки зупинила залу: «Минулого року я говорив про попит на 500 мільярдів доларів із високою впевненістю. А зараз, саме в цю мить, я бачу цифру щонайменше 1 трильйон доларів. І я впевнений, що реальний попит ще вищий.»

Після цих слів акції NVIDIA того ж дня зросли більш ніж на 4,3%. Але 黃仁勳 не просто називав цифри, він цілу промову присвятив тому, звідки береться цей трильйон і чому його все ще недостатньо.

Вступ: 20-річний ефект «запуску» CUDA

Початок усього виступу — це основна діяльність NVIDIA — CUDA. Цього року виповнюється 20 років з моменту створення CUDA, і 黃仁勳 назвав її «100% стратегічною логікою NVIDIA».

Простими словами: CUDA — це технологія, яка дозволяє розробникам писати програми для GPU. 20 років тому, коли вона з’явилася, ніхто не був впевнений у її успіху, але NVIDIA вклала більшу частину ресурсів компанії, щоб її підтримати. Тепер, оглядаючись назад, можна сказати, що це рішення створило майже неперевершену конкурентну перевагу — сотні мільйонів GPU, що виконують CUDA, розкидані по всьому світу, десятки тисяч відкритих проектів, що залежать від неї, і кожен хмарний сервіс її інтегрував.

黃仁勳 називає це «запуском» (flywheel): велика кількість пристроїв → залучення розробників → створення нових алгоритмів → прориви в алгоритмах, що відкривають нові ринки → розширення пристроїв у нових ринках → знову запуск. Ще краще, що NVIDIA постійно оновлює оптимізацію програмного забезпечення: GPU архітектури Ampere, випущені шість років тому, у хмарі все ще зростають у ціні — бо застосувань все більше і вони все цінніші.

Економіка Token фабрики: дата-центри більше не зберігають файли, а виробляють Token

Це — найголовніша ідея виступу 黃仁勳 і ключова логіка, що пояснює попит у 1 трильйон доларів.

Простими словами: раніше дата-центри були «складами», де зберігали файли та дані; тепер — це «фабрики», що виробляють базову одиницю AI — Token (можна зрозуміти як найменшу одиницю мислення і мовлення AI).

黃仁勳 каже, що кожен дата-центр обмежений електроенергією: потужність у 1 гігават (GW) ніколи не стане 2 гігаватами — це фізичний закон. Тому головне питання конкуренції — хто зможе виробляти найбільше Token за ту ж кількість електроенергії? Той, у кого найвищий вивід Token на ват, матиме найнижчі витрати і виграє.

Token матиме багаторівневе ціноутворення, як бізнес-класи в авіалініях:

Безкоштовний рівень (висока пропускна здатність, низька швидкість)
Середній рівень (близько 3 доларів за мільйон Token)
Вищий рівень (близько 6 доларів за мільйон Token)
Швидкий рівень (близько 45 доларів за мільйон Token)
Надшвидкий рівень (близько 150 доларів за мільйон Token)

Інакше кажучи, одна й та сама GPU — 黃仁勳 радить розподілити її потужність між цими рівнями: чим вищий рівень пропускної здатності і швидкість, тим більше заробляєш. За його оцінками, нова система Grace Blackwell, побудована на архітектурі Hopper, при тій же потужності може приносити у 5 разів більше доходу, ніж попередня.

Vera Rubin: за два роки 350-кратне зростання, це не закон Мура, це інша крива

黃仁勳 каже, що, згадуючи попередню архітектуру Hopper, він може підняти шматок чипа; але коли мова йде про Vera Rubin, всі думають про всю систему.

Цифри говорять самі за себе: у тому ж дата-центрі з потужністю 1 гігават, швидкість генерації Token зросла з 22 мільйонів/сек до 700 мільйонів/сек — у 350 разів за два роки. А за той самий час закон Мура дає лише 1,5-кратне зростання.

Яким є цей монстр-систем? Vera Rubin — це 100% рідинне охолодження, дизайн, що повністю позбавлений традиційних кабелів: раніше потрібно було два дні на встановлення стелажу, тепер — всього дві години. 黃仁勳 каже, що Microsoft Azure вже підтвердив запуск першого Vera Rubin.

Справжня мета придбання Groq: робити швидше — швидше, дорожче — дорожче

Інтеграція технологій Groq у NVIDIA — не для заміни власних GPU, а для створення «асиметричного розділення виведення» — звучить складно, але простіше: розділити процес виведення AI на два етапи і використовувати найкращі інструменти для кожного.

Чипи Groq мають багато високошвидкісної SRAM (500 МБ), дуже швидкі, але з малою пам’яттю — ідеальні для останнього етапу виведення Token. Чип Vera Rubin має велику пам’ять (288 ГБ), підходить для початкових великих обчислень і кешування.

NVIDIA використовує програмне забезпечення Dynamo, щоб з’єднати ці дві системи: «попереднє заповнення» і механізм уваги для декодування — все це виконує Vera Rubin, а для дуже чутливих до затримки етапів генерації Token — Groq. Обидві системи з’єднані через Ethernet, що зменшує загальну затримку приблизно вдвічі.

黃仁勳 також дає рекомендацію щодо конфігурації: якщо основне завдання — висока пропускна здатність, використовувати 100% Vera Rubin; якщо потрібно багато високоякісного генерації коду — виділити близько 25% потужності дата-центру для Groq. Чип LP30 від Groq вже масово виробляється Samsung і має вийти у третьому кварталі.

DLSS 5: графіка отримує свій момент GPT

黃仁勳 каже, що десять років тому GeForce приніс AI у світ, а тепер AI повертається, щоб переформатувати комп’ютерну графіку. Він називає цю нову технологію «нейронне рендерингування» (Neural Rendering), тобто DLSS 5.

Головна ідея — поєднати традиційну визначену 3D-графіку (чітку структуру, точний контроль) із ймовірнісним естетичним підходом генеративного AI. Структуровані дані забезпечують контроль над зображенням, а AI робить його неймовірно красивим і реалістичним. 黃仁勳 каже, що ця «інтеграція структурованих даних і генеративного AI» буде повторюватися у багатьох галузях.

OpenClaw: операційна система епохи інтелектуальних агентів

Peter Steinberger створив OpenClaw, і 黃仁勳 назвав його «найпопулярнішим відкритим проектом у історії людства, що за кілька тижнів перевершив досягнення Linux за тридцять років».

Що таке OpenClaw? Простими словами: це дозволяє AI-агентам керувати ресурсами, викликати інструменти, читати і писати файли, планувати задачі і розбивати великі проблеми на менші — так само, як операційна система дозволяє програмам працювати на комп’ютері. Але тепер — для AI-агентів у корпоративному IT-середовищі.

黃仁勳 каже: «Кожна SaaS-компанія стане AaaS — AI as a Service». Тобто, замість просто продавати інструменти, компанії продаватимуть «послуги AI-агентів, що допомагають робити справи».

Але у корпоративному середовищі є питання безпеки: агент може мати доступ до конфіденційних даних і виконувати код. Тому NVIDIA випустила NeMo Claw — корпоративний референсний дизайн із системою стратегій і приватним маршрутизатором, щоб забезпечити безпечне впровадження агентів у компаніях.

Майбутнє: кожен інженер матиме бюджет Token

黃仁勳 робить конкретний прогноз: «У майбутньому кожен інженер у компанії матиме щорічний бюджет Token. Їхня зарплата може сягати сотень тисяч доларів, і я додатково даватиму їм Token, що становитимуть половину їхньої зарплати, щоб їхній продуктивність зросла у 10 разів. Кількість Token, що видається при наймі, вже стала новою темою рекрутингу у Кремнієвій долині.»

Це — не метафора, а його переконання, що у майбутньому конкурентоспроможність компанії визначатиметься тим, скільки ресурсів (Token) вона дає своїм інженерам. Кожна компанія стане і користувачем, і виробником Token.

Фізичний AI і армія роботів

黃仁勳 каже, що цифрові інтелекти рухаються у цифровий світ, а фізичний AI — це ті самі інтелекти, але у фізичній формі — роботах. На цьому GTC представлено 110 моделей роботів, що охоплюють майже всі провідні компанії у цій галузі.

У сфері автономного водіння, 黃仁勳 оголосив, що BYD, Hyundai, Nissan і Geely приєдналися до платформи RoboTaxi Ready NVIDIA, разом виробляючи 18 мільйонів автомобілів на рік, поряд із Mercedes-Benz, Toyota і General Motors. NVIDIA також повідомила про співпрацю з Uber для розгортання і підключення RoboTaxi Ready автомобілів у кількох містах.

У фінальній частині, робот-сніговик Olaf від Disney вийшов на сцену, використовуючи чип Jetson як мозок, навчився ходити у Omniverse і адаптувався до реального світу за допомогою фізичного рушія Newton. 黃仁勳 і Olaf поспілкувалися кілька хвилин, і він пожартував: «Я думав, ти буде вищий. Я ніколи не бачив такого низького сніговика.»

Наступне покоління: архітектура Feynman + космічний дата-центр

Наприкінці виступу 黃仁勳 «злив» інформацію про нову архітектуру Feynman, яка вперше підтримуватиме одночасно мідь і оптичне з’єднання з рівною масштабованістю. А ще більш далека мрія — «Vera Rubin Space-1» — дата-центр у космосі, що виведе AI-обчислення за межі Землі.

黃仁勳 підсумував усю промову у чотирьох пунктах: настання моменту для виведення, відкриття епохи AI-фабрик, революція інтелектуальних агентів OpenClaw, масштабне впровадження фізичного AI. І один трильйон доларів — лише початок.

Переглянути оригінал

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Прокоментувати

0/400

Немає коментарів