У нещодавньому блозі Nvidia йдеться, що GPU Blackwell коштують майже вдвічі дорожче за годину порівняно з поколінням Hopper, але забезпечують у 35 разів нижчі витрати на інференс на токен. Як тестову модель використали DeepSeek-R1: оренда Blackwell (GB300 NVL72) становить $2,65 за GPU на годину проти $1,41 для Hopper, однак пропускна здатність одного GPU зростає з 90 до 6 000 токенів за секунду. Такий приріст пропускної здатності у 65 разів знижує витрати на мільйон токенів з $4,20 до $0,12.
Показник $0,12 передбачає повну оптимізацію програмного забезпечення, включно з інференсом у низькій точності FP4 та багатотокенним прогнозуванням (MTP). Якщо MTP не ввімкнено, витрати на мільйон токенів досягають приблизно $2,35, а з увімкненим MTP падають до $0,11, демонструючи, що лише ця функція дає ефект оптимізації у 21 раз.
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до
Застереження.
Пов'язані статті
Операційний прибуток LG CNS зріс на 19% у 1 кварталі завдяки зростанню в сегментах AI та хмарних сервісів
Згідно з Chosun Daily, LG CNS повідомила 30 квітня, що операційний прибуток у першому кварталі зріс на 19,4% у річному вимірі до 94,2 мільярда вон (64,1 млн доларів США) завдяки попиту на AI та хмарні сервіси. Виручка зросла на 8,6% до 1,3 трильйона вон (894 млн доларів США).
Підрозділ компанії з AI та хмарних сервісів згенерував 765,4 біллі
GateNews13хв. тому
OpenAI запустила GPT-5.5-Cyber: протистояння з Anthropic Mythos
OpenAI оголосила про запуск GPT-5.5-Cyber, спеціально створеного для кібербезпеки. Він буде розгорнутий у «найближчі кілька днів» через механізм довіреного доступу з урядовою координацією для ключових оборонних підрозділів, а не для відкритого продажу. Це контрастує з відкритим шляхом Anthropic Mythos: Білому дому не подобається розширення до 70 компаній. Preparedness Framework оцінив ситуацію як High (але не critical), водночас посилюючи захист кібербезпеки. Надалі стежитимуть за переліком під час розгортання, можливим включенням CISA та розбіжностями в обох сторін щодо стандартів безпеки.
ChainNewsAbmedia46хв. тому
Виручка Schneider Electric у І кварталі досягла 9,8 млрд євро, зросла на 11,2% завдяки попиту на AI дата-центри
За повідомленням Reuters, Schneider Electric повідомила про дохід у першому кварталі на рівні 9,8 млрд євро (11,4 млрд доларів США) 30 квітня, а органічне зростання піднялося до 11,2% на тлі попиту на AI-ЦОД. Французький постачальник обладнання для електроживлення та охолодження заявив, що результат був трохи вищим за консенсус-оцінки та
GateNews53хв. тому
Protum залучає 2 мільйони доларів у посівний раунд для платформи AI-управління, плануючи закриття угоди в червні 2026 року
Згідно з TechCrunch Startup Spotlight, Protum — AI-стартап із корпоративного управління — залучає seed-раунд на суму 2 мільйони доларів, який планує закрити до червня 2026 року. Заснований Сандіпом J., що має 25 років досвіду трансформації великих компаній, Protum надає платформу, створену для того, щоб давати підприємствам безперервний
GateNews1год тому
Сплеск звільнень у бізнесі може призвести до глухого кута «роботодавець—працівники», вважають дослідники: слід запровадити податок на автоматизацію за допомогою ШІ
Дослідження вказує на зовнішні ефекти скорочень працівників через використання ШІ: витрати на звільнення є вигодою, яку отримує лише компанія, але втрата купівельної спроможності лягає на весь ринок. Чим більше звільнень, тим слабший попит — і обидві сторони програють. Пропонується запровадити збір «податку на автоматизацію за допомогою ШІ», щоб інтегрувати зовнішні витрати в ринкові розрахунки, а також фінансувати перепідготовку через податкові надходження, щоб відновити попит і стабілізувати економіку.
ChainNewsAbmedia1год тому
Claude стягуватиме мовний податок? Дослідження: переклад китайського, японського та корейського контенту споживає найбільше токенів — майже втричі більше
Дослідник Komatsuzaki у дописі в X зазначив, що в токенізаторах основних LLM існує «податок на неангломовність». Під час перекладу тестів із книги «The Bitter Lesson» Claude має приріст кількості токенів для гінді, арабської, російської та китайської приблизно 3,24×, 2,86×, 2,04× і 1,71× відповідно — це помітно більше, ніж у OpenAI. Китайські локальні моделі краще пристосовані до китайської, що свідчить про зумовлену англомовними тренувальними даними нерівність витрат і стає перешкодою для поширення.
ChainNewsAbmedia1год тому