Guojin Securities: AI Agent Drives Non-linear Growth in Computing Power Demand - Focus on Industrial Chain Investment Opportunities

MaticHoleFiller · 2026-03-24T09:10:03+00:00

Індустрія штучного інтелекту переживає важливий поворот, коли довгострокові агенти замінюють одноразові взаємодії, що стимулює нелінійне зростання попиту на обчислювальні потужності. ШІ еволюціонує від інструменту для відповідей на питання до автономного агенту, споживання токенів значно зростає, попит підприємств на мультиагентні системи стрімко зростає. Ця трансформація створює високий попит на пам'ять та обчислювальні можливості, який впливає на майбутній розвиток технологій.

MaticHoleFiller

2026-03-24 09:10:03

Генерація анотацій у процесі

23 березня, 248 000 зірок на GitHub, у 4 рази більше витрат на токени, зростання запитів від компаній на 1445% — ці дані малюють ключовий поворот у розвитку AI-індустрії: перехід від Prompt до довготривалого Agent вже розпочався. Дані платформи OpenRouter показують, що багатоступеневе мислення швидко замінює одноповерховий діалог; практичні дослідження Anthropic свідчать, що витрати токенів на один Agent приблизно у 4 рази більші, ніж у режимі діалогу, а системи з кількома Agent — до 15 разів. Зі зростанням тривалості роботи Agent зростає і потреба у обчислювальній потужності, що веде до нової нелінійної фази розширення.

Перехід у парадигмі обчислювальних потреб: від Prompt до довготривалого Agent

Інтерактивна парадигма штучного інтелекту зазнає фундаментальних змін: AI-системи вже еволюціонували від одноразових інструментів запитань і відповідей до автономних Agent, здатних до мислення, планування та безперервної роботи. Цей тренд підтверджується даними платформи OpenRouter: багатоступеневе мислення та ланцюгові виклики інструментів швидко витісняють традиційний одноповерховий діалог. Відкритий фреймворк Agent OpenClaw, запущений лише чотири місяці тому, зібрав понад 248 000 зірок на GitHub і став найпопулярнішим відкритим проектом у світі, що свідчить про перехід довготривалих Agent із експериментальної стадії до повноцінного виробничого використання. 2) Витрати токенів на завдання з агентами вже значно перевищують традиційні сценарії запитань і відповідей: практичні дослідження Anthropic показують, що один Agent споживає приблизно у 4 рази більше токенів, ніж у режимі діалогу, а системи з кількома Agent — до 15 разів. У січні 2026 року компанія NVIDIA у своєму технічному блозі чітко зазначила, що наступне покоління AI-заводів повинно мати здатність обробляти сотні тисяч вхідних токенів, щоб підтримувати довгий контекст, необхідний для агентного мислення. Перехід у парадигмі вже відбувся, і формуються нові логіки зростання потреб у обчислювальній потужності.

Зростання потреб у обчислювальній потужності через довготривалий Agent

Основні причини зростання попиту на обчислювальні ресурси для довготривалих Agent: 1) Технічні механізми: по-перше, обчислювальні витрати великих моделей через механізм самовнимання (self-attention) зростають у квадратичній залежності від довжини контексту; по-друге, етап розгадування (Decode) природно обмежений пропускною здатністю пам’яті, оскільки KV-кеші (Key-Value cache) лінійно зростають із довжиною контексту, що знижує ефективність GPU, створюючи вузькі місця у пропускній здатності. Вартість обладнання у провідних компаніях, таких як Google Gemini 3.1 Pro та Alibaba Cloud Qwen, відображає цю фізичну реальність — вони застосовують цінову політику, що залежить від довжини контексту. 2) Виникнення архітектур з кількома агентами додає додатковий рівень комунікаційних витрат. За даними Gartner, у першому кварталі 2024 року — другому кварталі 2025 року — запити компаній щодо систем з кількома агентами зросли на 1445%; дослідження Google DeepMind показують, що глобальне стиснення контексту між паралельними агентами викликає неминучий “податок на координацію”, і витрати на комунікацію зростають нелінійно з кількістю агентів. 3) Парадокс Джевенса ще більше посилює ці ефекти: генеральний директор Microsoft, Надлера, прогнозує, що підвищення ефективності моделей у мисленні знизить витрати, але водночас стимулює швидше зростання обсягів використання.

Загалом, збільшення тривалості роботи Agent — неминучий технічний тренд. У найближчому майбутньому потреби у пропускній здатності пам’яті, швидкості обміну даними та інтелектуальній обчислювальній щільності будуть зростати нелінійно.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

1 лайків