Guojin Securities: AI Agent Drives Non-linear Growth in Computing Power Demand - Focus on Industrial Chain Investment Opportunities

robot
Генерація анотацій у процесі

23 березня, 248 000 зірок на GitHub, у 4 рази більше витрат на токени, зростання запитів від компаній на 1445% — ці дані малюють ключовий поворот у розвитку AI-індустрії: перехід від Prompt до довготривалого Agent вже розпочався. Дані платформи OpenRouter показують, що багатоступеневе мислення швидко замінює одноповерховий діалог; практичні дослідження Anthropic свідчать, що витрати токенів на один Agent приблизно у 4 рази більші, ніж у режимі діалогу, а системи з кількома Agent — до 15 разів. Зі зростанням тривалості роботи Agent зростає і потреба у обчислювальній потужності, що веде до нової нелінійної фази розширення.

Перехід у парадигмі обчислювальних потреб: від Prompt до довготривалого Agent

  1. Інтерактивна парадигма штучного інтелекту зазнає фундаментальних змін: AI-системи вже еволюціонували від одноразових інструментів запитань і відповідей до автономних Agent, здатних до мислення, планування та безперервної роботи. Цей тренд підтверджується даними платформи OpenRouter: багатоступеневе мислення та ланцюгові виклики інструментів швидко витісняють традиційний одноповерховий діалог. Відкритий фреймворк Agent OpenClaw, запущений лише чотири місяці тому, зібрав понад 248 000 зірок на GitHub і став найпопулярнішим відкритим проектом у світі, що свідчить про перехід довготривалих Agent із експериментальної стадії до повноцінного виробничого використання. 2) Витрати токенів на завдання з агентами вже значно перевищують традиційні сценарії запитань і відповідей: практичні дослідження Anthropic показують, що один Agent споживає приблизно у 4 рази більше токенів, ніж у режимі діалогу, а системи з кількома Agent — до 15 разів. У січні 2026 року компанія NVIDIA у своєму технічному блозі чітко зазначила, що наступне покоління AI-заводів повинно мати здатність обробляти сотні тисяч вхідних токенів, щоб підтримувати довгий контекст, необхідний для агентного мислення. Перехід у парадигмі вже відбувся, і формуються нові логіки зростання потреб у обчислювальній потужності.

Зростання потреб у обчислювальній потужності через довготривалий Agent

Основні причини зростання попиту на обчислювальні ресурси для довготривалих Agent: 1) Технічні механізми: по-перше, обчислювальні витрати великих моделей через механізм самовнимання (self-attention) зростають у квадратичній залежності від довжини контексту; по-друге, етап розгадування (Decode) природно обмежений пропускною здатністю пам’яті, оскільки KV-кеші (Key-Value cache) лінійно зростають із довжиною контексту, що знижує ефективність GPU, створюючи вузькі місця у пропускній здатності. Вартість обладнання у провідних компаніях, таких як Google Gemini 3.1 Pro та Alibaba Cloud Qwen, відображає цю фізичну реальність — вони застосовують цінову політику, що залежить від довжини контексту. 2) Виникнення архітектур з кількома агентами додає додатковий рівень комунікаційних витрат. За даними Gartner, у першому кварталі 2024 року — другому кварталі 2025 року — запити компаній щодо систем з кількома агентами зросли на 1445%; дослідження Google DeepMind показують, що глобальне стиснення контексту між паралельними агентами викликає неминучий “податок на координацію”, і витрати на комунікацію зростають нелінійно з кількістю агентів. 3) Парадокс Джевенса ще більше посилює ці ефекти: генеральний директор Microsoft, Надлера, прогнозує, що підвищення ефективності моделей у мисленні знизить витрати, але водночас стимулює швидше зростання обсягів використання.

Загалом, збільшення тривалості роботи Agent — неминучий технічний тренд. У найближчому майбутньому потреби у пропускній здатності пам’яті, швидкості обміну даними та інтелектуальній обчислювальній щільності будуть зростати нелінійно.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити