Новейшая модель искусственного интеллекта Alibaba QwQ-32B-Preview превосходит OpenAI O1 по некоторым показателям

Cryptopolitan
MATH1,61%

По мере усиления конкуренции в области искусственного интеллекта, китайский розничный гигант Alibaba представил свою QwQ-32B-Preview, которая, как сообщается, превосходит серию o1 от OpenAI.

Последняя модель, по сообщениям, превосходит модели o1-preview и o1-mini от OpenAI по некоторым конкретным показателям, таким как тесты AIME и MATH, которые оценивают производительность моделей искусственного интеллекта в логических головоломках и математических задачах.

Alibaba предоставляет для загрузки QwQ-32B-Preview.

Согласно розничному гиганту, новая модель Alibaba способна справляться с комплексными и сложными проблемами в сравнении с обычными большими языковыми моделями (LLM), такими как ChatGPT-4 и Claude 3.5.

Статья Benzinga указывает, что QwQ-32B-Preview - одна из немногих доступных под лицензией с разрешительными условиями, позволяющей пользователям скачивать и использовать ее. Модель теперь доступна на платформе разработки искусственного интеллекта Hugging Face.

Однако Alibaba выпустила определенные компоненты модели, чтобы ограничить полное воспроизведение модели или понимание ее работы.

Последняя модель Alibaba имеет 32,5 миллиарда параметров, что позволяет ей обрабатывать до 32 000 слов. Благодаря значительным возможностям модели и полуоткрытому доступу новый продукт Alibaba создает предпосылки для кардинального скачка в технологиях искусственного интеллекта.

Прозрачное заявление Alibaba, которое подчеркивает сложность ее модели, OpenAI держит свои параметры в секрете.

Появление этой модели происходит в то время, когда OpenAI делает значительные шаги в секторе искусственного интеллекта. В октябре капитализация OpenAI выросла до $157 миллиардов после успешного раунда финансирования.

Ранее на этой неделе группа SoftBank SFTBF, предположительно, увеличила свою застейкать в производителе ChatGPT через выкуп акций сотрудников на $1,5 миллиарда.

OpenAI, как сообщается, также исследует создание собственного веб-браузера для конкуренции с браузером Google Chrome, дочерним предприятием компании Alphabet, после давления, оказываемого Министерством юстиции США на его отделение.

Alibaba также признает, что модель имеет недостатки

Хотя у него есть некоторые уникальные преимущества, у новой модели также есть ограничения. По мнению группы, у QwQ-32B-Preview есть проблемы, такие как неожиданные переключения языка, которые могут запутать пользователей. Модель также показывает низкую производительность в задачах, требующих здравого смысла, что является общим для многих AI.

Согласно AutoGPT, модель может застрять в логических петлях, задерживая ответы.

Несмотря на свои недостатки, его способности к рассуждению позволяют ему проверять факты, тем самым уменьшая ошибки, но увеличивая время разрешения.

Размышляя над задачами и планируя шаги, модель Alibaba избегает некоторых подводных камней, которые влияют на традиционное искусственное интеллект. Но этот подход требует дополнительного времени, что может ограничить его применение в реальном времени.

Согласно Benzinga, ответы ‘QwQ-32B-Preview’ соответствуют китайским нормам регулирования и избегают политических чувствительных тем.

Например, политически чувствительные темы, такие как Тайвань, будут давать ответы, соответствующие позиции китайского правительства.

Кроме того, вопросы о событиях, таких как площадь Тяньаньмэн, не вызывают реакции, что показывает осторожное проектирование модели.

Хотя это может быть идеальным для китайского рынка, это также может ограничить его привлекательность на мировом рынке. Однако модель является значительным шагом в мир рассуждающего искусственного интеллекта. Хотя его ограничения могут сузить его мировую привлекательность, его другие компоненты, такие как логика и полуоткрытый характер, делают его большим конкурентом для OpenAI.

Согласно AutoGPT, QwQ-32B-Предварительный обзор подчеркивает потенциал и вызовы этой захватывающей границы, на которой лаборатории искусственного интеллекта по всему миру работают над совершенствованием технологии рассуждения.

От нуля до веб-про: ваш план запуска карьеры на 90 дней

Посмотреть Оригинал
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
GateUser-a578b9cfvip
· 2024-11-29 23:43
покупайте падения 🤑
Посмотреть ОригиналОтветить0