Із загостренням конкуренції в галузі штучного інтелекту китайський роздрібний гігант Alibaba представив свій QwQ-32B-Preview, який, як повідомляється, перевершує серію o1 від OpenAI.
Остання модель, як повідомляється, перевершує моделі OpenAI o1-preview та o1-mini за деякими конкретними показниками, такими як тести AIME та MATH, які оцінюють продуктивність моделей AI в логічних головоломках та математичних задачах.
Alibaba створила QwQ-32B-Preview для завантаження.
За словами роздрібного гіганта, нова модель Alibaba може впоратися зі складними і заплутаними проблемами порівняно зі звичайними великими мовними моделями (LLM), такими як ChatGPT-4 і Claude 3.5.
Стаття Бензинга вказує на те, що QwQ-32B-Preview є одним з небагатьох, доступних за ліцензією з високою допустимістю, що дозволяє користувачам завантажувати й використовувати його. Модель тепер доступна на платформі розробки штучного інтелекту Hugging Face.
Однак Alibaba випустила певні компоненти моделі, щоб обмежити повне копіювання моделі або вдумливої роботи з нею.
Остання модель Alibaba має 32,5 мільярда параметрів, що дозволяє їй обробляти до 32 000 слів. Значні можливості моделі та напіввідкритий доступ роблять нову модель Alibaba відмінною від інших та встановлюють межі для трансформаційного стрибка в технологіях мислення штучного інтелекту.
Прозора оголошення Alibaba, яке підкреслює високу складність її моделі, OpenAI тримає свої параметри в секреті.
Прихід цієї моделі відбувається в той час, коли OpenAI робить значні кроки в секторі штучного інтелекту. У жовтні капіталізація OpenAI зросла до $157 мільярдів після успішного раунду фінансування.
Раніше на цьому тижні, група SoftBank SFTBF, як повідомляється, збільшила своє застейкати в виробнику ChatGPT через викуп акцій на суму 1,5 мільярда доларів для співробітників.
OpenAI, як відомо, також вивчає можливість розробки власного веб-переглядача, щоб викликати браузер Alphabet’s підприємства Google Chrome після тиску з боку Департаменту юстиції США на його відчуження.
Алібаба визнає, що модель також має недоліки
Незважаючи на те, що він має кілька унікальних переваг, нова модель також має свої обмеження. За даними групи, QwQ-32B-Preview має проблеми, такі як неочікувані перемикання мови, що може спричинити плутанину для користувачів. Модель також не виконує завдання, які потребують здорового глузду, що є загальним для багатьох систем штучного інтелекту.
За даними AutoGPT, модель може потрапити в логічні петлі, затримуючи відповіді.
Незважаючи на свої недоліки, його можливості мислення дозволяють йому перевіряти факти, тим самим зменшуючи помилки, але збільшуючи час розв’язання.
Розуміючи завдання та плануючи кроки, модель Alibaba уникає деяких проблем, які впливають на традиційні ШІ. Але цей підхід вимагає додаткового часу, що може обмежувати його застосування в реальному часі.
За даними Benzinga, відповіді на QwQ-32B-Preview відповідають китайським регуляторним стандартам, уникаючи політично чутливі теми.
Наприклад, політично чутливі теми, такі як Тайвань, викликають відповіді, що відповідають позиції китайського уряду.
Крім того, інформація про події, такі як площа Тяньаньме́нь, не викликає жодних відповідей, що свідчить про обережний дизайн моделі.
Хоча це може бути ідеальним для китайського ринку, це також може обмежити його привабливість на світовому ринку. Однак модель є важливим кроком у світ розумної штучної інтелекту. Хоча його обмеження можуть звузити його світову привабливість, інші компоненти, такі як логіка та напіввідкритий характер, роблять його великим конкурентом для OpenAI.
Згідно з AutoGPT, QwQ-32B-Preview підкреслює потенціал та виклики цієї захоплюючої фронти, де лабораторії штучного інтелекту по всьому світу працюють над вдосконаленням технології мислення.
Від Нуля до Веб3 Професіонала: Ваш план запуску кар’єри на 90 днів